18阅读
2回复

[智能应用]AI是我的实习生，也是我的老师 [复制链接]

上一主题下一主题查看指定楼层

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 167327

金币: 490414

道行: 20030

原创: 766

奖券: 359

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 20596(小时)
注册时间: 2012-06-21
最后登录: 2026-01-13

只看楼主倒序阅读使用道具楼主发表于: 11小时前

AI可以成为导演的“后悔药”
对齐Lab：你们创作AI短片的工作流是什么样的？
阿文：创作《故宫猫猫上班记》《文明小猫游浦东》的时候，就是用最好的图像模型和视频模型来文生图、文生视频或者图生视频。
浦东新区文明办联合海辛&阿文作品《文明小猫游浦东》(01:20)
我们把大量的时间花在了抽卡上。《故宫猫猫上班记》中有一个镜头，我花了差不多2000块钱都没有抽出来，当时就崩溃了。其实很简单，就一只猫跳上树。但我需要它在一个特定的机位、特定的构图，比如说让它跳到树干上的某个位置，后面这个镜头就没要。作为一个从传统行业过来的设计师和创作者，我接受不了花一整天的时间去做一个镜头，最后什么成果都没有。
海辛：我们会边创作做边推翻之前的想法，其实废稿会比正片多很多。这种把前期、后期、制作整合在一起的模式，我还挺喜欢的，能不断地进行调整。
这也是每个导演都最想要的一种创作模式，很少有人能前期百分百知道什么是自己想要的。其实很多导演会想换一些想法，但鉴于巨大的成本以及制作是一个不可逆推的环境，他可能没有办法随意改动。
对齐Lab：跟传统流程在周期和成本上的差别是什么？
海辛：AI短片和传统短片的区别，不同影片类型上会有一些差别。以《故宫猫猫上班记》为例，首先传统流程里很少能找到这么配合的猫咪演员，因此大概率得全部用特效制作。比较普通的工作室，特效的报价大概在一秒1500元到3000元。
由于（用特效做）写实的猫咪是非常难的，要花费大量的成本才能让猫咪的毛发渲染符合人的审美，AI能大幅削减这方面的成本。但对于一些真人影片或者是产品拍摄，可能成本的降幅就不会有那么大。

海辛和阿文在创作《故宫猫猫上班记》时用AI生成的橘猫。图片来源：通往AGI之路。
对齐Lab：猫猫会成为你们的一个IP或者坚持的主线吗？
阿文：我们没有刻意去强调这个，主要是我们就喜欢猫。
AI可以是老师也可以是实习生
对齐Lab：AI作为你们创作中的“第三人”，扮演了什么样的角色？
阿文：我觉得AI的角色定位是流动的。现实中很难找到一个人既是你的老师又是你的实习生。AI可以在工作流的各个环节里扮演不一样的角色。
海辛：AI可以让我更聚焦创作和内容本身。以前拍一个镜头，我会把想要的画面分解成很多具体的步骤，会考虑演员、走位、场面调度、灯光等各种细节，AI帮我做了很多这方面琐碎的工作。
对齐Lab：不同的AI工具会不会有不同的人设？
海辛：会，特别是早期的时候。早期不同AI模型的能力侧重方向不同，有的可能更擅长稳定角色，有的可能在物理运动方面更符合现实。但现在这些模型的gap在变小，会越来越像一个通用的模型。
我会觉得Sora和Veo是两个非常截然不同的路径。Veo能很好地执行你提供的制作需求，Sora因为有切镜头的能力，所以更多是帮助你进行创意策划。
对齐Lab：AI创作者的核心能动性体现在哪里？
海辛：我觉得是非工具化的那一部分，因为工具的部分迟早会被AI追上来。能做出什么样的东西取决于你的经历、你爱的东西、你在意的议题，这些东西会决定你的创作上限。
阿文：创作者的品味非常重要。过去看过什么？受过什么样的影响？这些都会体现在作品里。如果想要保持自己的品味，或者让自己品味越来越好的话，必须大量摄入优质的养分。

2025年11月28日举行的中国报业传媒行业人工智能应用大会上，海辛代表团队分享和AI一起跨界的多种可能。图片来源：澎湃新闻。
对齐Lab：你们有一个阶段说过自己的定位是AI艺术的科学家，现在还这么想吗？
海辛：我觉得这是一个非常好的时代，你可以去定义未来AI会怎么发展。我们会训练一些小模型，探索AI可以产出哪些与过往作品不同的东西。
我们自己探索的一个方向叫“潜空间计划”。我们发现，过去一个图像到一个图像之间的变化是像素之间的。在 AI 大模型里面，两张截然不同的图像之间是语义、文化概念加上像素的变化。

海辛将黑猫、黑桃、月相图和罗盘结合到一起做了一个动画，她认为这种AI动画就像诗歌一样，是意象之间的跳转。视频来源：海辛的微信视频号
阿文：ComfyUI里当时有一项比较有名的技术叫AnimateDiff，它能让两张图像非常丝滑地过渡。我们就会好奇，任意两张图像之间是否存在一个最短的距离。
对齐Lab：有点像六度社交理论。
阿文：对的，当时海辛就选了香蕉和圣经两个非常不相关的概念。我们测试下来发现，香蕉变成圣经自然过渡要80帧。
海辛：因为样本很小，这个实验可能不代表任何东西。但这个猜想本身我们特别喜欢，而且很浪漫。万物之间的任何概念，它可能都存在一个最短的距离。
多用AI工具，多看人类作品
对齐Lab：以电影节评委的角色来看，一部作品把AI用在哪些方面是更能打动你的？
海辛：我自己会特别喜欢在前一分钟能够给我很多信息量的作品。我更会被好的内容打动，而不是好的工具形式。
阿文：我不看AI短片（笑），我只制作。我经常会说多用AI工具，多看人类作品。
现在有一些不好的现象，大量的AI短片要么重复，要么过度地透支某种审美和风格。很多所谓的AI创作者，他只盯着头部的几个AI创作者去模仿、抄袭。明明AI是放大创意的工具，但很多人却用来偷懒，这是我非常不喜欢看 AI 短片的一个原因。
另外一个原因是学习的需求。以导演的视角再去看以前看过的电影时，往往会发现很多我可以学习的地方。补看过去的一些经典作品时候，我会感叹原来我们曾经吃得有这么的好。
对齐Lab：作为头部创作者，你们也会面临一些抄袭的问题，你们是怎么看待版权方面的问题的？

有公司直接把海辛和阿文的作品放在了自己公司的作品集里。图片来源：微博
海辛：我们会要求自己的商业作品符合商业版权的规范。这一方面是甲方的要求，另一方面也是对自己的保护。反过来说，我们没有好的保护自己作品不被侵权的方式。
阿文：我们商量下来的对策是每次都做得难抄一点，每次在技术上翻一翻或者想象力上翻一翻。
对齐Lab：一些娱乐公司或者影视公司开始向 AI 工具发起版权挑战，这方面你们怎么想？
海辛：他们有权这么做。AI公司也会有一些对策，比如用户生成带有IP的图像或者视频，AI公司会把提示词禁掉。我觉得整个行业会越来越规范。
阿文：我觉得只是表面上更规范了。OpenAI就是很好的例子，训练模型的时候没有征得你的同意，就先把你的作品练进去。等你有意见了，我再把关键词禁掉，但模型已经获得了所有的能力了。
中国团队对AI开源社区的贡献很大
对齐Lab：怎么理解“AI 让创作能力可以复用，创作者能够把能力变成产品”？
海辛：我们曾经在ComfyUI（一种节点式的AI视觉创作工具）里搭过一个很复杂的工作流，这个工作流能够把一张照片和文案变成一张精美的海报。我们把工作流导出后发给别人，这样就能复现我们的创作过程。
海辛和阿文用ComfyUI创作了把一张图片变成穆夏风格海报的工作流，并开源在了civitai上。图片来源：civitai
对齐Lab：你们主要还是开源的方式去分享？
海辛：我们自己的工作流是开源的，也会有一些合作。去年春晚的时候，我们作为顾问，参与了阿里团队春晚云参演证的生成器项目，用ComfyUI的流程做了一套AI滤镜放在了淘宝上。任何人上传自己的照片，就可以生成一张在春晚工作的云参演证。

春晚云参演证效果图。图片来源：数英网
对齐Lab：这算定制AI作品外的另一种商业模式？
海辛：ComfyUI 有段时间特别火，几乎成了 AI 应用的行业范式之一了：通过定制 comfyUI 工作流，来完成垂类具体的需求。但现在由于大模型足够聪明，很多工作流都被大模型内化了。你直接告诉大模型，大模型就可以帮你做出来。
阿文：GPT-4o刚出来的时候算是对我们过去工作流的一次打击，但我们并不觉得之前的工作就浪费了。有幸能参与到那个非常短暂的时代，成为开源社区的一部分，我们也很荣幸。
当媒体还在宣扬国外模型的时候，AI开源社区中超过一半的开源模型、插件和技术方案都来自中国团队。他们之间好像没有大厂之分，都是非常优秀的个体，轮番登上历史舞台。
AI让我有了完整的作品，抛开AI我更像工具人
对齐Lab：AI补全了你们什么？抛开AI，你们又看到了自己什么？
海辛：AI补全了我的学习途径。很多知识在过去是很难获得的，现在AI就是最好的老师。抛开 AI 我是什么？这也是我最近会思考一个问题。我觉得职业上的训练正在把人工具化，但人其实很难卷过AI，AI可能就是更好的工具。反过来我会去思考，作为一个人类我的情感是什么？我想传递的内容和价值是什么？
阿文：AI补全了我技能上缺失的版图，这对我来说非常重要。以前我过于沉迷技术，以至于我看起来很厉害，但能拿出来完整作品其实很少。虽然我整天活跃在社交媒体上，但我做出来的要么是demo，要么是半成品。
有了AI之后，我第一次意识到自己能做出完整的作品。我能做出大家喜欢的东西，不仅仅是个工具人。AI甚至改变了我的职业方向。
抛开AI的话，我能想象到职业生涯里会少非常多完整的作品。有了AI，我的作品集可能会变得很不一样。
对齐Lab：未来5年内，AI的哪些变化是值得关注的？
阿文：实时生成技术。目前谷歌发布了一个Demo，但还处于玩具的状态。这项技术如果真的落地，会改变我们对于内容方式呈现。比如游戏、电影，很值得期待。

2025年8月，谷歌DeepMind发布新一代Genie3世界模型。Genie3实现了用户交互的实时响应，支持使用提示词生成世界事件，并能维持数分钟的一致性。图片来源：谷歌
海辛：我觉得是硬件。我希望大模型能放进任何一个硬件（玩偶、手办等）里面，这样AI与人的交互就不单单仅限于屏幕。像这样可以脱离屏幕本身的交互会很让人期待，它不会局限在一个2D的环境里，未来可能整个房子都可以和我互动。

山庄提示：道行不够，道券不够？---☆点此充值☆

我有我可以

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 167327

金币: 490414

道行: 20030

原创: 766

奖券: 359

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 20596(小时)
注册时间: 2012-06-21
最后登录: 2026-01-13

只看该作者沙发发表于: 11小时前

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

应将AI视为兼具“实习生”执行力与“老师”启发性的双重角色，但需明确其工具本质，主导权始终在人。

🧩 角色定位：AI为何既是实习生，也是老师？
当前关于AI在工作与学习中的定位，存在两种主流隐喻：“AI是实习生”和“AI是老师”。这两种说法并不矛盾，而是适用于不同场景的互补视角：

作为实习生：强调AI能承担具体、重复、低风险的任务，如代码补全、文档整理、数据清洗等。你需像带新人一样指导它、审核它的输出。
作为老师：突出AI的知识广度和即时反馈能力，可随时解答疑问、提供学习路径、生成教学材料，尤其适合自主学习场景。
角色    核心功能    人类职责    典型使用方式示例
AI是实习生    执行任务、产出初稿    指导方向、审查结果    让AI写函数、做PPT草稿、生成测试用例
AI是老师    解释概念、启发思路、辅导学习    提出问题、判断答案合理性    问AI“如何理解Transformer？”、“帮我设计学习计划”
（补充说明）这种双重性源于AI的能力特点：它有海量知识（类老师），但缺乏判断力与责任感（类实习生）1。

⚖️ 如何平衡这两种角色？
1. 在工作中，以“实习生”为主导
当你需要完成项目时，把AI当作执行者：

分解任务，一次只给一个明确指令

审查所有输出，特别是涉及安全、逻辑或架构的部分 10
不让AI接触敏感信息，防止数据泄露 1
2. 在学习中，以“老师”为辅助
当你要掌握新技能时，利用AI的即时响应优势：

请它解释难点、对比技术方案、推荐学习资源 5
但必须自己动手验证，避免陷入“假性掌握” 11
用AI生成练习题并自我检测，形成闭环
3. 避免误区：不要真把它当“上司”或“保姆”
❌ 完全依赖AI做决策 → 可能引发严重错误（如误删数据库）10
❌ 让AI代替思考全过程 → 导致自身能力退化 11
✅ 正确做法：保持主导地位，让AI放大你的效率而非替代你
✅ 结论：AI是增强版的认知协作者
AI既不是完全可控的“实习生”，也不是权威可靠的“老师”，而是一个高能但不稳定的认知协作者。最高效的使用方式是：

在熟悉领域，让它当实习生，帮你提效；
在探索阶段，让它当老师，帮你启思；
始终记住：你是指挥官，它是工具。
只有当你具备足够的专业知识，才能真正驾驭AI，否则反而会被它误导。

如何不发帖就快速得到金币和道行

我有我可以

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 218467

金币: 664910

道行: 2006

原创: 2444

奖券: 3260

斑龄: 41

道券: 1203

获奖: 0

座驾

设备

摄影级

在线时间: 47556(小时)
注册时间: 2008-10-01
最后登录: 2026-01-13

只看该作者板凳发表于: 10小时前

一句话点评：
AI正重塑影视创作生态：从“高成本试错”到“低成本迭代”，从“工具依赖”到“创意共生”，创作者与AI的“双向赋能”正在定义未来内容产业的新范式。
多维度解析：
一、AI如何重构创作流程：从“高成本试错”到“低成本迭代”
1. 传统创作的“不可逆性”：
成本高昂：以《故宫猫猫上班记》为例，传统特效制作猫咪跳树镜头需1秒1500-3000元，且需反复调整机位、构图，阿文曾花费2000元仍未达到预期，最终放弃该镜头。
流程僵化：传统影视制作需前期分镜、演员调度、后期特效等严格分工，导演若想修改创意，需付出巨大时间与资金成本，导致“想法落地难”。

2. AI的“低成本试错”能力：
“抽卡式”创作：阿文团队通过AI文生图、图生视频，快速生成多个版本镜头（如猫咪跳树），仅需调整提示词即可尝试不同构图，成本从“万元级”降至“百元级”。
废稿率与效率：海辛提到，AI创作中废稿远多于正片，但这种“边创作边推翻”的模式，反而让团队能实时优化创意，避免传统流程中“前期规划与后期执行脱节”的问题。
二、AI的角色定位：从“工具”到“创作伙伴”
1. AI的“流动角色”：
实习生模式：AI承担琐碎工作（如灯光、场面调度），让创作者聚焦核心创意。例如，海辛过去需手动分解镜头步骤，现在AI可直接生成符合需求的画面。
老师模式：AI提供知识支持（如历史背景、文化符号），帮助创作者突破认知边界。海辛认为，AI是“最好的老师”，能快速补全创作所需的知识缺口。

2. 不同AI工具的“人设分化”：
功能侧重：早期AI模型差异显著（如Sora擅长创意策划，Veo专注执行需求），创作者需根据场景选择工具。
通用化趋势：随着模型融合，AI逐渐向“全能助手”演进，但创作者仍需通过提示词设计、工作流搭建等“非工具化能力”体现核心价值。
三、AI创作者的核心竞争力：品味、经历与“反工具化”
1. 品味决定上限：
审美积累：阿文强调，创作者的品味源于过往作品影响（如经典电影、艺术史），AI可放大创意，但无法替代“大量摄入优质养分”形成的独特风格。
案例对比：当前AI短片存在“重复审美”问题，部分创作者仅模仿头部作品，导致内容同质化，而头部创作者（如海辛、阿文）通过技术迭代与想象力突破，保持作品差异性。

2. “反工具化”能力：
技术翻新：面对版权抄袭问题，阿文团队选择“每次做得难抄一点”，通过技术复杂度（如工作流设计）或想象力（如概念融合）构建壁垒。
职业反思：海辛指出，职业训练易使人“工具化”，而AI的崛起迫使创作者回归“人类情感与价值传递”的本质，例如通过作品探讨社会议题、文化符号等深层内容。
四、AI与影视产业的未来：实时生成、硬件交互与开源生态
1. 技术突破方向：
实时生成：阿文认为，谷歌Genie3等实时交互技术若成熟，将颠覆游戏、电影等内容形式，实现“所见即所得”的创作体验。
硬件融合：海辛期待AI模型嵌入物理载体（如玩偶、手办），使交互脱离屏幕，例如通过语音或动作触发AI生成内容，打造“全屋智能创作空间”。

2. 商业模式创新：
工作流开源：海辛团队将ComfyUI工作流开源，通过“定制化模板”满足垂类需求（如春晚云参演证生成器），虽面临大模型内化工作流的挑战，但仍为行业提供轻量化解决方案。
版权与规范：面对AI版权争议（如训练数据侵权），海辛认为行业将逐步规范，例如AI公司禁用IP相关提示词，但阿文质疑此举仅是“表面规范”，模型能力已通过训练数据固化。

3. 中国开源社区的贡献：
技术主导权：阿文指出，AI开源社区中超半数模型、插件来自中国团队，个体创作者通过开源协作推动技术普惠，打破大厂垄断，例如ComfyUI的流行即是中国开发者影响力的体现。
五、AI对创作者的“补全”与“觉醒”
1. AI补全技能缺口：
从“技术狂人”到“完整创作者”：阿文过去沉迷技术，导致作品多为demo或半成品，AI帮助其整合技能链，实现“从创意到成品”的全流程输出，改变职业方向。
学习途径拓展：海辛认为，AI降低了知识获取门槛，创作者可通过对话式学习快速掌握新领域（如物理引擎、文化符号），突破传统学习路径的限制。

2. 抛开AI后的自我认知：
工具与人的博弈：海辛反思，职业训练使人趋向工具化，而AI的崛起迫使创作者重新定义自身价值——从“执行者”转向“意义赋予者”，通过作品传递情感与价值观。
阿文的“作品集革命”：AI让阿文首次拥有完整作品集，而非零散技术展示，这使其在行业中从“技术达人”转型为“内容创作者”，获得更广泛的认可。

总结：AI正以“低成本试错”“流动角色”“技术翻新”等方式重构影视创作生态，但创作者的核心价值仍在于“品味积累”“反工具化能力”与“人类情感传递”。未来，随着实时生成、硬件交互等技术突破，以及中国开源社区的推动，AI与创作的融合将进入“深度共生”阶段，定义内容产业的新范式。

如何不发帖就快速得到金币和道行

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]AI是我的实习生，也是我的老师 [复制链接]