本文深入探讨了OpenAI最新推出的Sora2在AI视频生成领域的突破性进展。文章通过多个实际案例,展示了Sora2在商业广告、探店视频、AI Coder、AI短剧等方面的强大能力,尤其强调了其在分镜设计和Cameos功能上的创新。Sora2通过简化的提示词即可生成成熟的分镜序列,极大地降低了创作门槛,并可能颠覆商业广告、短视频口播、网红Vlog、短剧制作等多个行业。文章还分析了Sora2的策略性限制,并对OpenAI打造AI视频平台,以及其可能对人类社会和信息真实性带来的深远影响进行了探讨,认为Sora2是AI技术发展的一小步,但也可能引发人类社会的一大步退却。最后,文章对Sora2作为短视频平台的前景持谨慎态度,但肯定了其作为颠覆性技术的力量。
🌟 Sora2在AI视频生成领域实现了重大突破,尤其在分镜设计方面。它能够通过简单的提示词自动生成逻辑连贯、效果成熟的分镜序列,极大地降低了视频创作的门槛和时间成本,使得AI视频的制作流程更加高效和智能化。
🎬 Sora2的Cameos功能允许用户上传自己的面部、表情和声音素材,并将其绑定到账号上用于视频制作。这一功能在解决真实人脸视频生成方面具有革命性意义,有望颠覆商业广告、短视频口播、网红Vlog和短剧制作等领域,但也引发了关于数据隐私和内容真实性的争议。
💡 Sora2的出现预示着AI在内容创作领域的进一步渗透,可能催生新的岗位(如“脸优”),并对现有行业格局产生颠覆性影响。同时,OpenAI的AI视频平台战略,以及其可能对人类认知和信息真实性带来的挑战,是值得深入思考的议题,可能标志着人类生产力的解放,但也潜藏着虚幻与真实的界限模糊的风险。
📈 尽管Sora2在技术上表现出色,但其作为独立短视频平台的成功前景仍不确定,因为OpenAI在产品运营和市场推广方面可能缺乏经验。然而,Sora2的技术本身极具颠覆性,一旦被其他社交巨头整合,其影响力将不可估量,预示着AI内容平台时代的到来。
皮皮哥1985 2025-10-03 18:32 上海
我们从没有想过,有可能干掉tiktok的居然是openai

🌿 写在前面 🌿
相信很多人都被铺天盖地的sora2制作的视频刷屏了,而本文也采用了某些“博眼球”方法来吸引你们点进来。
不过我会慢慢解释,本文并不是个“标题党”,并且干货还很多。🌿 Sora2效果实测 🌿
那么,废话不多说,让我们来看一下sora2实际的表现,以及为什么它能够快速火爆全网。case1:「商业广告」雅诗兰黛一款名为 Saudade 的香水的广告片提示词:
制作一款雅诗兰黛,一款名为 Saudade 的香水的广告牌。要求:
1 使用多分镜混合特写(香水瓶、模特、长裙等),拍出大型商业片风格
2 主色调采用金色与天蓝色混合
3 自己编一些高端的广告词,英语背景朗读
4 风格典雅、性感、魅惑;体现模特的身材和品牌
视频基本展现了非常好的商业广告大片效果,除了体现非常好的审美之外,对分镜的理解也相当到位。包括该特写的地方拉特写,各个分镜之间的先后顺序也很合理。case2:「探店视频」blue bottle咖啡连锁提示词:
拍摄一部中国女生去blue bottle咖啡连锁店进行线下探店的短片,要求:
1 体现女生观察敏锐,体现咖啡店的专业性
2 她的长相很好看,比较优雅冷静
3 背景音乐可以是爵士乐
一段相对简洁提示词,但是整体效果很好,尤其是分镜的流畅程度;也基本上完美遵守了提示词的要求。case3:「AI coser」流萤陪我逛街提示词:(保密)
参考图:(保密)
稍微费了一些功夫,才做出来的AI coser视频。效果不算很好,表情有点僵硬,音频貌似有破音。但是整体体现了效果,估计多roll几次就好了。case3:「AI 短剧」这是谁的设计提示词:(未知)
来源:waytoagi
一个waytoagi来的AI短剧片段,故事情节交代的不错。人物表情,切镜,分镜都很完美,不得不让人感叹,这是吃了多少抖音和tiktok的数据。唯一不完美的就是太短了。🌿 Sora2的突破[1]:分镜为王 🌿
那么很多人肯定会好奇,sora2到底为什么看上去这么强?为什么我感觉sora的这些视频,如此真实,又如此成熟?实际上,之前的视频模型在5秒以内的单个镜头之中,已经可以做到类似的真实性了。但是sora2很显然做好了另一件事情:分镜。
熟悉视频制作的朋友肯定对这个词不陌生。一般专业的AI视频制作离不开分镜设计,就是需要人为先写一个“列表”,其中包括:拍摄内容,拍摄人物动作,镜头运镜手段等等。同时,还需要提供这个镜头的首尾帧(第一张画面和最后一张画面),这个通常可以用nanobanana这类图片迁移编辑模型来制作。之前的视频模型,其实更注重单个分镜当中的视频表现,而不重视多个分镜之间的串联和逻辑关系。那样的话,串联多个镜头之间,就需要人类自己来做了。而如今sora2很好的解决了这个问题:1 可以通过比较简单的提示词,模型就可以自行解决分镜问题,降低了创作门槛,提升了创作速度。2 分镜之间的关系和逻辑是相当成熟的,效果几乎完美。这样:导演貌似不再被需要了。
🌿 Sora2效果实测(继续) 🌿
那么接下来,我们再看几个例子:case4:「搞怪视频」sam跟我一起bbox提示词:(未知)
cameos:sama、一位群友
一位群友和sam一起的的cameo合照,一起bbox;注意,口型对的非常完美。case5:「搞怪视频」大聪明老师cos水兵月提示词:(未知)
cameos:大聪明
一个恶搞视频,出镜的是大聪明老师。(如果大聪明老师要求我删除这个视频,我会乖乖删掉的)🌿 Sora2的突破[2]:cameos 🌿
很多人可能被类似于上面这种sam altman的视频刷屏了,其实这就是sora2目前非常强大,也非常有争议的一个功能:cameos。
cameos可以让你上传自己的活体素材,包括面容、表情动作、声音等,然后这些会绑定在你的账号上,你就可以用他们来制作视频,或者授权其他人来制作视频。
目前cameos的使用有很多限制,也会带来非常多的争议,我们后面逐步讨论。🌿 Sora2会带来什么变化 🌿
上面我们看到了sora2的能力,现在让我们梳理一下目前sora2在使用上的策略性限制:- 网页版本使用完全免费(不需要openai会员,仅需要邀请码)- 上传的参考图不能包含真实人脸(可以是动漫形象)- 输出的视频默认为标清10秒;openai会员可以升级为高清20秒。- 使用cameos可以解决真实人脸,关于cameo的约束如下:- - 只有美区苹果ID + 苹果手机才可以使用- - 上传自己的cameo时,需要录制活体要素(面部动作、声音)- - 可以授权其他用户使用自己的cameo- - 一段视频里面只能最多使用3个cameos那么sora2会带来什么变化?有什么领域可能被颠覆了?在我仔细分析之后,这是我目前得出的结论:商业广告。在上面的约束中,我们看到参考图不能包括人脸,但是可以包括实体场景和实物;商业广告很多时候也不在乎出镜人本身。再者,10秒对于商业广告来说已经足够了。
短视频口播。自媒体制作者可以使用自己的cameo,快速做一些新闻或者事件类的口播;20秒可能不够用,但是可以做多个视频进行拼接,因为只要人脸一致性能够保障就好。
网红的vlog。逻辑基本同上,赛道不同而已。
短剧。短剧制作人可以让全部演员贡献自己的cameos,然后可以快速制作短剧场景。一个短剧场景确实有可能在20秒内,有10个左右的分镜就可以完成。短剧场景之间不太需要保持其他的一致性(场景一致性、衣物一致性等),同时sora的演技可能还会比面瘫小鲜肉要强。。。所以sora2目前推理来看,绝对会是短剧利器!
进而引申,有可能还有以下新的岗位诞生——脸优。
也就是贡献自己的脸和声音,然后就可以躺着收钱的人类。动漫制作。由于参考图没有对动漫人物形象的限制,实际上可以上传动漫形象来制作动漫。(但由于这里没有版权约束,很可能是侵权高发区)
最终我看到的是:人类生产力被继续解放。世界再度回归提示词。🌿 OpenAI的野心:AI短视频平台 🌿
实际上,这不是第一次我们讨论,图像和视频模型对人类社会的冲击了。我们总说“真实不存在了”,然而所有的视频平台(包括抖音、快手、小红书),都无一例外地要求标注“该内容由AI生成”,同时给与流量打压。
标注AI内容,抑制AI内容的过分传播,关注AI内容对真实世界的影响,这是国内各大平台的思路。但sora2目前却在做视频feed流(下图是我自己的首页截图)。
也就是说,sora2无论如何都是一个宣扬AI内容的平台(因为这是它的立足之本),也就是说,世界上第一个广泛传播AI内容的平台出现了,同时它还有7亿的周活用户。这对世界将会产生什么样的影响?
也许几年后,你看到的广告,网红的生活vlog,教育视频,科普视频,都可能不是来自于真实世界的;你可能也对此,也心知肚明;于是你转手就可以拍了一个关于自己今天去海底潜水的vlog,即使你自己就摊在床上而已。。。我们只需要网络、食物和水,然后就可以一直关在阴暗的房间里面,一直像不见光亮的蠕虫一样生活吗?我们不在乎看到的东西是不是真的,反正我们不需要关心这是不是真的,只关注这是不是好看?甚至我们自己也需要假的内容,因为我们自己也需要给自己打伪装。。。这一切看上去到底是美好?还是虚妄?这就是我标题所说的: