切换到宽版
  • 18阅读
  • 2回复

[智能应用]AI是我的实习生,也是我的老师 [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
167327
金币
490414
道行
20030
原创
766
奖券
359
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 20596(小时)
注册时间: 2012-06-21
最后登录: 2026-01-13
只看楼主 倒序阅读 使用道具 楼主  发表于: 11小时前
AI可以成为导演的“后悔药”
对齐Lab:你们创作AI短片的工作流是什么样的?
阿文:创作《故宫猫猫上班记》《文明小猫游浦东》的时候,就是用最好的图像模型和视频模型来文生图、文生视频或者图生视频。
浦东新区文明办联合海辛&阿文作品《文明小猫游浦东》(01:20)
我们把大量的时间花在了抽卡上。《故宫猫猫上班记》中有一个镜头,我花了差不多2000块钱都没有抽出来,当时就崩溃了。其实很简单,就一只猫跳上树。但我需要它在一个特定的机位、特定的构图,比如说让它跳到树干上的某个位置,后面这个镜头就没要。作为一个从传统行业过来的设计师和创作者,我接受不了花一整天的时间去做一个镜头,最后什么成果都没有。
海辛:我们会边创作做边推翻之前的想法,其实废稿会比正片多很多。这种把前期、后期、制作整合在一起的模式,我还挺喜欢的,能不断地进行调整。
这也是每个导演都最想要的一种创作模式,很少有人能前期百分百知道什么是自己想要的。其实很多导演会想换一些想法,但鉴于巨大的成本以及制作是一个不可逆推的环境,他可能没有办法随意改动。
对齐Lab:跟传统流程在周期和成本上的差别是什么?
海辛:AI短片和传统短片的区别,不同影片类型上会有一些差别。以《故宫猫猫上班记》为例,首先传统流程里很少能找到这么配合的猫咪演员,因此大概率得全部用特效制作。比较普通的工作室,特效的报价大概在一秒1500元到3000元。
由于(用特效做)写实的猫咪是非常难的,要花费大量的成本才能让猫咪的毛发渲染符合人的审美,AI能大幅削减这方面的成本。但对于一些真人影片或者是产品拍摄,可能成本的降幅就不会有那么大。

海辛和阿文在创作《故宫猫猫上班记》时用AI生成的橘猫。图片来源:通往AGI之路。
对齐Lab:猫猫会成为你们的一个IP或者坚持的主线吗?
阿文:我们没有刻意去强调这个,主要是我们就喜欢猫。
AI可以是老师也可以是实习生
对齐Lab:AI作为你们创作中的“第三人”,扮演了什么样的角色?
阿文:我觉得AI的角色定位是流动的。现实中很难找到一个人既是你的老师又是你的实习生。AI可以在工作流的各个环节里扮演不一样的角色。
海辛:AI可以让我更聚焦创作和内容本身。以前拍一个镜头,我会把想要的画面分解成很多具体的步骤,会考虑演员、走位、场面调度、灯光等各种细节,AI帮我做了很多这方面琐碎的工作。
对齐Lab:不同的AI工具会不会有不同的人设?
海辛:会,特别是早期的时候。早期不同AI模型的能力侧重方向不同,有的可能更擅长稳定角色,有的可能在物理运动方面更符合现实。但现在这些模型的gap在变小,会越来越像一个通用的模型。
我会觉得Sora和Veo是两个非常截然不同的路径。Veo能很好地执行你提供的制作需求,Sora因为有切镜头的能力,所以更多是帮助你进行创意策划。
对齐Lab:AI创作者的核心能动性体现在哪里?
海辛:我觉得是非工具化的那一部分,因为工具的部分迟早会被AI追上来。能做出什么样的东西取决于你的经历、你爱的东西、你在意的议题,这些东西会决定你的创作上限。
阿文:创作者的品味非常重要。过去看过什么?受过什么样的影响?这些都会体现在作品里。如果想要保持自己的品味,或者让自己品味越来越好的话,必须大量摄入优质的养分。

2025年11月28日举行的中国报业传媒行业人工智能应用大会上,海辛代表团队分享和AI一起跨界的多种可能。图片来源:澎湃新闻。
对齐Lab:你们有一个阶段说过自己的定位是AI艺术的科学家,现在还这么想吗?
海辛:我觉得这是一个非常好的时代,你可以去定义未来AI会怎么发展。我们会训练一些小模型,探索AI可以产出哪些与过往作品不同的东西。
我们自己探索的一个方向叫“潜空间计划”。我们发现,过去一个图像到一个图像之间的变化是像素之间的。在 AI 大模型里面,两张截然不同的图像之间是语义、文化概念加上像素的变化。

海辛将黑猫、黑桃、月相图和罗盘结合到一起做了一个动画,她认为这种AI动画就像诗歌一样,是意象之间的跳转。视频来源:海辛的微信视频号
阿文:ComfyUI里当时有一项比较有名的技术叫AnimateDiff,它能让两张图像非常丝滑地过渡。我们就会好奇,任意两张图像之间是否存在一个最短的距离。
对齐Lab:有点像六度社交理论。
阿文:对的,当时海辛就选了香蕉和圣经两个非常不相关的概念。我们测试下来发现,香蕉变成圣经自然过渡要80帧。
海辛:因为样本很小,这个实验可能不代表任何东西。但这个猜想本身我们特别喜欢,而且很浪漫。万物之间的任何概念,它可能都存在一个最短的距离。
多用AI工具,多看人类作品
对齐Lab:以电影节评委的角色来看,一部作品把AI用在哪些方面是更能打动你的?
海辛:我自己会特别喜欢在前一分钟能够给我很多信息量的作品。我更会被好的内容打动,而不是好的工具形式。
阿文:我不看AI短片(笑),我只制作。我经常会说多用AI工具,多看人类作品。
现在有一些不好的现象,大量的AI短片要么重复,要么过度地透支某种审美和风格。很多所谓的AI创作者,他只盯着头部的几个AI创作者去模仿、抄袭。明明AI是放大创意的工具,但很多人却用来偷懒,这是我非常不喜欢看 AI 短片的一个原因。
另外一个原因是学习的需求。以导演的视角再去看以前看过的电影时,往往会发现很多我可以学习的地方。补看过去的一些经典作品时候,我会感叹原来我们曾经吃得有这么的好。
对齐Lab:作为头部创作者,你们也会面临一些抄袭的问题,你们是怎么看待版权方面的问题的?

有公司直接把海辛和阿文的作品放在了自己公司的作品集里。图片来源:微博
海辛:我们会要求自己的商业作品符合商业版权的规范。这一方面是甲方的要求,另一方面也是对自己的保护。反过来说,我们没有好的保护自己作品不被侵权的方式。
阿文:我们商量下来的对策是每次都做得难抄一点,每次在技术上翻一翻或者想象力上翻一翻。
对齐Lab:一些娱乐公司或者影视公司开始向 AI 工具发起版权挑战,这方面你们怎么想?
海辛:他们有权这么做。AI公司也会有一些对策,比如用户生成带有IP的图像或者视频,AI公司会把提示词禁掉。我觉得整个行业会越来越规范。
阿文:我觉得只是表面上更规范了。OpenAI就是很好的例子,训练模型的时候没有征得你的同意,就先把你的作品练进去。等你有意见了,我再把关键词禁掉,但模型已经获得了所有的能力了。
中国团队对AI开源社区的贡献很大
对齐Lab:怎么理解“AI 让创作能力可以复用,创作者能够把能力变成产品”?
海辛:我们曾经在ComfyUI(一种节点式的AI视觉创作工具)里搭过一个很复杂的工作流,这个工作流能够把一张照片和文案变成一张精美的海报。我们把工作流导出后发给别人,这样就能复现我们的创作过程。
海辛和阿文用ComfyUI创作了把一张图片变成穆夏风格海报的工作流,并开源在了civitai上。图片来源:civitai
对齐Lab:你们主要还是开源的方式去分享?
海辛:我们自己的工作流是开源的,也会有一些合作。去年春晚的时候,我们作为顾问,参与了阿里团队春晚云参演证的生成器项目,用ComfyUI的流程做了一套AI滤镜放在了淘宝上。任何人上传自己的照片,就可以生成一张在春晚工作的云参演证。

春晚云参演证效果图。图片来源:数英网
对齐Lab:这算定制AI作品外的另一种商业模式?
海辛:ComfyUI 有段时间特别火,几乎成了 AI 应用的行业范式之一了:通过定制 comfyUI 工作流,来完成垂类具体的需求。但现在由于大模型足够聪明,很多工作流都被大模型内化了。你直接告诉大模型,大模型就可以帮你做出来。
阿文:GPT-4o刚出来的时候算是对我们过去工作流的一次打击,但我们并不觉得之前的工作就浪费了。有幸能参与到那个非常短暂的时代,成为开源社区的一部分,我们也很荣幸。
当媒体还在宣扬国外模型的时候,AI开源社区中超过一半的开源模型、插件和技术方案都来自中国团队。他们之间好像没有大厂之分,都是非常优秀的个体,轮番登上历史舞台。
AI让我有了完整的作品,抛开AI我更像工具人
对齐Lab:AI补全了你们什么?抛开AI,你们又看到了自己什么?
海辛:AI补全了我的学习途径。很多知识在过去是很难获得的,现在AI就是最好的老师。抛开 AI 我是什么?这也是我最近会思考一个问题。我觉得职业上的训练正在把人工具化,但人其实很难卷过AI,AI可能就是更好的工具。反过来我会去思考,作为一个人类我的情感是什么?我想传递的内容和价值是什么?
阿文:AI补全了我技能上缺失的版图,这对我来说非常重要。以前我过于沉迷技术,以至于我看起来很厉害,但能拿出来完整作品其实很少。虽然我整天活跃在社交媒体上,但我做出来的要么是demo,要么是半成品。
有了AI之后,我第一次意识到自己能做出完整的作品。我能做出大家喜欢的东西,不仅仅是个工具人。AI甚至改变了我的职业方向。
抛开AI的话,我能想象到职业生涯里会少非常多完整的作品。有了AI,我的作品集可能会变得很不一样。
对齐Lab:未来5年内,AI的哪些变化是值得关注的?
阿文:实时生成技术。目前谷歌发布了一个Demo,但还处于玩具的状态。这项技术如果真的落地,会改变我们对于内容方式呈现。比如游戏、电影,很值得期待。

2025年8月,谷歌DeepMind发布新一代Genie3世界模型。Genie3实现了用户交互的实时响应,支持使用提示词生成世界事件,并能维持数分钟的一致性。图片来源:谷歌
海辛:我觉得是硬件。我希望大模型能放进任何一个硬件(玩偶、手办等)里面,这样AI与人的交互就不单单仅限于屏幕。像这样可以脱离屏幕本身的交互会很让人期待,它不会局限在一个2D的环境里,未来可能整个房子都可以和我互动。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
167327
金币
490414
道行
20030
原创
766
奖券
359
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 20596(小时)
注册时间: 2012-06-21
最后登录: 2026-01-13
只看该作者 沙发  发表于: 11小时前
应将AI视为兼具“实习生”执行力与“老师”启发性的双重角色,但需明确其工具本质,主导权始终在人。

🧩 角色定位:AI为何既是实习生,也是老师?
当前关于AI在工作与学习中的定位,存在两种主流隐喻:“AI是实习生”和“AI是老师”。这两种说法并不矛盾,而是适用于不同场景的互补视角:

作为实习生:强调AI能承担具体、重复、低风险的任务,如代码补全、文档整理、数据清洗等。你需像带新人一样指导它、审核它的输出。
作为老师:突出AI的知识广度和即时反馈能力,可随时解答疑问、提供学习路径、生成教学材料,尤其适合自主学习场景。
角色    核心功能    人类职责    典型使用方式示例
AI是实习生    执行任务、产出初稿    指导方向、审查结果    让AI写函数、做PPT草稿、生成测试用例
AI是老师    解释概念、启发思路、辅导学习    提出问题、判断答案合理性    问AI“如何理解Transformer?”、“帮我设计学习计划”
(补充说明)这种双重性源于AI的能力特点:它有海量知识(类老师),但缺乏判断力与责任感(类实习生)1。

⚖️ 如何平衡这两种角色?
1. 在工作中,以“实习生”为主导
当你需要完成项目时,把AI当作执行者:

分解任务,一次只给一个明确指令

审查所有输出,特别是涉及安全、逻辑或架构的部分 10
不让AI接触敏感信息,防止数据泄露 1
2. 在学习中,以“老师”为辅助
当你要掌握新技能时,利用AI的即时响应优势:

请它解释难点、对比技术方案、推荐学习资源 5
但必须自己动手验证,避免陷入“假性掌握” 11
用AI生成练习题并自我检测,形成闭环
3. 避免误区:不要真把它当“上司”或“保姆”
❌ 完全依赖AI做决策 → 可能引发严重错误(如误删数据库)10
❌ 让AI代替思考全过程 → 导致自身能力退化 11
✅ 正确做法:保持主导地位,让AI放大你的效率而非替代你
✅ 结论:AI是增强版的认知协作者
AI既不是完全可控的“实习生”,也不是权威可靠的“老师”,而是一个高能但不稳定的认知协作者。最高效的使用方式是:

在熟悉领域,让它当实习生,帮你提效;
在探索阶段,让它当老师,帮你启思;
始终记住:你是指挥官,它是工具。
只有当你具备足够的专业知识,才能真正驾驭AI,否则反而会被它误导。
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
218467
金币
664910
道行
2006
原创
2444
奖券
3260
斑龄
41
道券
1203
获奖
0
座驾
设备
摄影级
在线时间: 47556(小时)
注册时间: 2008-10-01
最后登录: 2026-01-13
只看该作者 板凳  发表于: 10小时前
一句话点评:  
AI正重塑影视创作生态:从“高成本试错”到“低成本迭代”,从“工具依赖”到“创意共生”,创作者与AI的“双向赋能”正在定义未来内容产业的新范式。  
多维度解析:  
一、AI如何重构创作流程:从“高成本试错”到“低成本迭代”  
1. 传统创作的“不可逆性”:  
成本高昂:以《故宫猫猫上班记》为例,传统特效制作猫咪跳树镜头需1秒1500-3000元,且需反复调整机位、构图,阿文曾花费2000元仍未达到预期,最终放弃该镜头。  
流程僵化:传统影视制作需前期分镜、演员调度、后期特效等严格分工,导演若想修改创意,需付出巨大时间与资金成本,导致“想法落地难”。  

2. AI的“低成本试错”能力:  
“抽卡式”创作:阿文团队通过AI文生图、图生视频,快速生成多个版本镜头(如猫咪跳树),仅需调整提示词即可尝试不同构图,成本从“万元级”降至“百元级”。  
废稿率与效率:海辛提到,AI创作中废稿远多于正片,但这种“边创作边推翻”的模式,反而让团队能实时优化创意,避免传统流程中“前期规划与后期执行脱节”的问题。  
二、AI的角色定位:从“工具”到“创作伙伴”  
1. AI的“流动角色”:  
实习生模式:AI承担琐碎工作(如灯光、场面调度),让创作者聚焦核心创意。例如,海辛过去需手动分解镜头步骤,现在AI可直接生成符合需求的画面。  
老师模式:AI提供知识支持(如历史背景、文化符号),帮助创作者突破认知边界。海辛认为,AI是“最好的老师”,能快速补全创作所需的知识缺口。  

2. 不同AI工具的“人设分化”:  
功能侧重:早期AI模型差异显著(如Sora擅长创意策划,Veo专注执行需求),创作者需根据场景选择工具。  
通用化趋势:随着模型融合,AI逐渐向“全能助手”演进,但创作者仍需通过提示词设计、工作流搭建等“非工具化能力”体现核心价值。  
三、AI创作者的核心竞争力:品味、经历与“反工具化”  
1. 品味决定上限:  
审美积累:阿文强调,创作者的品味源于过往作品影响(如经典电影、艺术史),AI可放大创意,但无法替代“大量摄入优质养分”形成的独特风格。  
案例对比:当前AI短片存在“重复审美”问题,部分创作者仅模仿头部作品,导致内容同质化,而头部创作者(如海辛、阿文)通过技术迭代与想象力突破,保持作品差异性。  

2. “反工具化”能力:  
技术翻新:面对版权抄袭问题,阿文团队选择“每次做得难抄一点”,通过技术复杂度(如工作流设计)或想象力(如概念融合)构建壁垒。  
职业反思:海辛指出,职业训练易使人“工具化”,而AI的崛起迫使创作者回归“人类情感与价值传递”的本质,例如通过作品探讨社会议题、文化符号等深层内容。  
四、AI与影视产业的未来:实时生成、硬件交互与开源生态  
1. 技术突破方向:  
实时生成:阿文认为,谷歌Genie3等实时交互技术若成熟,将颠覆游戏、电影等内容形式,实现“所见即所得”的创作体验。  
硬件融合:海辛期待AI模型嵌入物理载体(如玩偶、手办),使交互脱离屏幕,例如通过语音或动作触发AI生成内容,打造“全屋智能创作空间”。  

2. 商业模式创新:  
工作流开源:海辛团队将ComfyUI工作流开源,通过“定制化模板”满足垂类需求(如春晚云参演证生成器),虽面临大模型内化工作流的挑战,但仍为行业提供轻量化解决方案。  
版权与规范:面对AI版权争议(如训练数据侵权),海辛认为行业将逐步规范,例如AI公司禁用IP相关提示词,但阿文质疑此举仅是“表面规范”,模型能力已通过训练数据固化。  

3. 中国开源社区的贡献:  
技术主导权:阿文指出,AI开源社区中超半数模型、插件来自中国团队,个体创作者通过开源协作推动技术普惠,打破大厂垄断,例如ComfyUI的流行即是中国开发者影响力的体现。  
五、AI对创作者的“补全”与“觉醒”  
1. AI补全技能缺口:  
从“技术狂人”到“完整创作者”:阿文过去沉迷技术,导致作品多为demo或半成品,AI帮助其整合技能链,实现“从创意到成品”的全流程输出,改变职业方向。  
学习途径拓展:海辛认为,AI降低了知识获取门槛,创作者可通过对话式学习快速掌握新领域(如物理引擎、文化符号),突破传统学习路径的限制。  

2. 抛开AI后的自我认知:  
工具与人的博弈:海辛反思,职业训练使人趋向工具化,而AI的崛起迫使创作者重新定义自身价值——从“执行者”转向“意义赋予者”,通过作品传递情感与价值观。  
阿文的“作品集革命”:AI让阿文首次拥有完整作品集,而非零散技术展示,这使其在行业中从“技术达人”转型为“内容创作者”,获得更广泛的认可。  

总结:AI正以“低成本试错”“流动角色”“技术翻新”等方式重构影视创作生态,但创作者的核心价值仍在于“品味积累”“反工具化能力”与“人类情感传递”。未来,随着实时生成、硬件交互等技术突破,以及中国开源社区的推动,AI与创作的融合将进入“深度共生”阶段,定义内容产业的新范式。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个