一支烟花AI 10月04日
Sora2:AI视频生成的技术突破与潜在影响
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文深入探讨了OpenAI最新推出的Sora2在AI视频生成领域的突破性进展。文章通过多个实际案例,展示了Sora2在商业广告、探店视频、AI Coder、AI短剧等方面的强大能力,尤其强调了其在分镜设计和Cameos功能上的创新。Sora2通过简化的提示词即可生成成熟的分镜序列,极大地降低了创作门槛,并可能颠覆商业广告、短视频口播、网红Vlog、短剧制作等多个行业。文章还分析了Sora2的策略性限制,并对OpenAI打造AI视频平台,以及其可能对人类社会和信息真实性带来的深远影响进行了探讨,认为Sora2是AI技术发展的一小步,但也可能引发人类社会的一大步退却。最后,文章对Sora2作为短视频平台的前景持谨慎态度,但肯定了其作为颠覆性技术的力量。

🌟 Sora2在AI视频生成领域实现了重大突破,尤其在分镜设计方面。它能够通过简单的提示词自动生成逻辑连贯、效果成熟的分镜序列,极大地降低了视频创作的门槛和时间成本,使得AI视频的制作流程更加高效和智能化。

🎬 Sora2的Cameos功能允许用户上传自己的面部、表情和声音素材,并将其绑定到账号上用于视频制作。这一功能在解决真实人脸视频生成方面具有革命性意义,有望颠覆商业广告、短视频口播、网红Vlog和短剧制作等领域,但也引发了关于数据隐私和内容真实性的争议。

💡 Sora2的出现预示着AI在内容创作领域的进一步渗透,可能催生新的岗位(如“脸优”),并对现有行业格局产生颠覆性影响。同时,OpenAI的AI视频平台战略,以及其可能对人类认知和信息真实性带来的挑战,是值得深入思考的议题,可能标志着人类生产力的解放,但也潜藏着虚幻与真实的界限模糊的风险。

📈 尽管Sora2在技术上表现出色,但其作为独立短视频平台的成功前景仍不确定,因为OpenAI在产品运营和市场推广方面可能缺乏经验。然而,Sora2的技术本身极具颠覆性,一旦被其他社交巨头整合,其影响力将不可估量,预示着AI内容平台时代的到来。

皮皮哥1985 2025-10-03 18:32 上海

我们从没有想过,有可能干掉tiktok的居然是openai

🌿 写在前面 🌿

相信很多人都被铺天盖地的sora2制作的视频刷屏了,而本文也采用了某些“博眼球”方法来吸引你们点进来。

不过我会慢慢解释,本文并不是个“标题党”,并且干货还很多。

🌿 Sora2效果实测 🌿

那么,废话不多说,让我们来看一下sora2实际的表现,以及为什么它能够快速火爆全网。

case1:「商业广告」雅诗兰黛一款名为 Saudade 的香水的广告片

提示词:

制作一款雅诗兰黛,一款名为 Saudade 的香水的广告牌。要求:

1 使用多分镜混合特写(香水瓶、模特、长裙等),拍出大型商业片风格

2 主色调采用金色与天蓝色混合

3 自己编一些高端的广告词,英语背景朗读

4 风格典雅、性感、魅惑;体现模特的身材和品牌

视频基本展现了非常好的商业广告大片效果,除了体现非常好的审美之外,对分镜的理解也相当到位。包括该特写的地方拉特写,各个分镜之间的先后顺序也很合理。

case2:「探店视频」blue bottle咖啡连锁

提示词:

拍摄一部中国女生去blue bottle咖啡连锁店进行线下探店的短片,要求:

1 体现女生观察敏锐,体现咖啡店的专业性

2 她的长相很好看,比较优雅冷静

3 背景音乐可以是爵士乐

一段相对简洁提示词,但是整体效果很好,尤其是分镜的流畅程度;也基本上完美遵守了提示词的要求。

case3:「AI coser」流萤陪我逛街

提示词:(保密)

参考图:(保密)

稍微费了一些功夫,才做出来的AI coser视频。效果不算很好,表情有点僵硬,音频貌似有破音。但是整体体现了效果,估计多roll几次就好了。

case3:「AI 短剧」这是谁的设计

提示词:(未知)

来源:waytoagi

一个waytoagi来的AI短剧片段,故事情节交代的不错。人物表情,切镜,分镜都很完美,不得不让人感叹,这是吃了多少抖音和tiktok的数据。唯一不完美的就是太短了。

🌿 Sora2的突破[1]:分镜为王 🌿

那么很多人肯定会好奇,sora2到底为什么看上去这么强?

为什么我感觉sora的这些视频,如此真实,又如此成熟?

实际上,之前的视频模型在5秒以内的单个镜头之中,已经可以做到类似的真实性了。但是sora2很显然做好了另一件事情:分镜。

熟悉视频制作的朋友肯定对这个词不陌生。一般专业的AI视频制作离不开分镜设计,就是需要人为先写一个“列表”,其中包括:拍摄内容,拍摄人物动作,镜头运镜手段等等。同时,还需要提供这个镜头的首尾帧(第一张画面和最后一张画面),这个通常可以用nanobanana这类图片迁移编辑模型来制作。

之前的视频模型,其实更注重单个分镜当中的视频表现,而不重视多个分镜之间的串联和逻辑关系。那样的话,串联多个镜头之间,就需要人类自己来做了。

而如今sora2很好的解决了这个问题:

1 可以通过比较简单的提示词,模型就可以自行解决分镜问题,降低了创作门槛,提升了创作速度。

2 分镜之间的关系和逻辑是相当成熟的,效果几乎完美。

这样:导演貌似不再被需要了。

🌿 Sora2效果实测(继续) 🌿

那么接下来,我们再看几个例子:

case4:「搞怪视频」sam跟我一起bbox

提示词:(未知)

cameos:sama、一位群友

一位群友和sam一起的的cameo合照,一起bbox;注意,口型对的非常完美。

case5:「搞怪视频」大聪明老师cos水兵月

提示词:(未知)

cameos:大聪明

一个恶搞视频,出镜的是大聪明老师。

(如果大聪明老师要求我删除这个视频,我会乖乖删掉的)

🌿 Sora2的突破[2]:cameos 🌿

很多人可能被类似于上面这种sam altman的视频刷屏了,其实这就是sora2目前非常强大,也非常有争议的一个功能:cameos。

cameos可以让你上传自己的活体素材,包括面容、表情动作、声音等,然后这些会绑定在你的账号上,你就可以用他们来制作视频,或者授权其他人来制作视频。

目前cameos的使用有很多限制,也会带来非常多的争议,我们后面逐步讨论。

🌿 Sora2会带来什么变化 🌿

上面我们看到了sora2的能力,现在让我们梳理一下目前sora2在使用上的策略性限制:

- 网页版本使用完全免费(不需要openai会员,仅需要邀请码)

- 上传的参考图不能包含真实人脸(可以是动漫形象)

- 输出的视频默认为标清10秒;openai会员可以升级为高清20秒。

- 使用cameos可以解决真实人脸,关于cameo的约束如下:

- - 只有美区苹果ID + 苹果手机才可以使用

- - 上传自己的cameo时,需要录制活体要素(面部动作、声音)

- - 可以授权其他用户使用自己的cameo

- - 一段视频里面只能最多使用3个cameos

那么sora2会带来什么变化?有什么领域可能被颠覆了?

在我仔细分析之后,这是我目前得出的结论:

商业广告。在上面的约束中,我们看到参考图不能包括人脸,但是可以包括实体场景和实物;商业广告很多时候也不在乎出镜人本身。再者,10秒对于商业广告来说已经足够了。

短视频口播。自媒体制作者可以使用自己的cameo,快速做一些新闻或者事件类的口播;20秒可能不够用,但是可以做多个视频进行拼接,因为只要人脸一致性能够保障就好。

网红的vlog。逻辑基本同上,赛道不同而已。

短剧。短剧制作人可以让全部演员贡献自己的cameos,然后可以快速制作短剧场景。一个短剧场景确实有可能在20秒内,有10个左右的分镜就可以完成。短剧场景之间不太需要保持其他的一致性(场景一致性、衣物一致性等),同时sora的演技可能还会比面瘫小鲜肉要强。。。所以sora2目前推理来看,绝对会是短剧利器!

进而引申,有可能还有以下新的岗位诞生——脸优。

也就是贡献自己的脸和声音,然后就可以躺着收钱的人类。

动漫制作。由于参考图没有对动漫人物形象的限制,实际上可以上传动漫形象来制作动漫。(但由于这里没有版权约束,很可能是侵权高发区)

最终我看到的是:

人类生产力被继续解放。

世界再度回归提示词。

🌿 OpenAI的野心:AI短视频平台 🌿

实际上,这不是第一次我们讨论,图像和视频模型对人类社会的冲击了。我们总说“真实不存在了”,然而所有的视频平台(包括抖音、快手、小红书),都无一例外地要求标注“该内容由AI生成”,同时给与流量打压。

标注AI内容,抑制AI内容的过分传播,关注AI内容对真实世界的影响,这是国内各大平台的思路。

但sora2目前却在做视频feed流(下图是我自己的首页截图)。

也就是说,sora2无论如何都是一个宣扬AI内容的平台(因为这是它的立足之本),也就是说,世界上第一个广泛传播AI内容的平台出现了,同时它还有7亿的周活用户。这对世界将会产生什么样的影响?

也许几年后,你看到的广告,网红的生活vlog,教育视频,科普视频,都可能不是来自于真实世界的;你可能也对此,也心知肚明;于是你转手就可以拍了一个关于自己今天去海底潜水的vlog,即使你自己就摊在床上而已。。。

我们只需要网络、食物和水,然后就可以一直关在阴暗的房间里面,一直像不见光亮的蠕虫一样生活吗?

我们不在乎看到的东西是不是真的,反正我们不需要关心这是不是真的,只关注这是不是好看?甚至我们自己也需要假的内容,因为我们自己也需要给自己打伪装。。。

这一切看上去到底是美好?还是虚妄?这就是我标题所说的:

Sora2是OpenAI进的一小步,但也“可能”是人类退的一大步。

当然,也仅仅是可能。

而更具威胁的事情还在后面,那就是目前openai是允许免费试用sora2的(邀请码);那么很显然,我们每一次使用也在给它贡献数据,后面可能我们就可以看到更强的sora,比如视频长度从20秒增长到60秒。

🌿 作为短视频平台,Sora2会成功吗? 🌿

于是乎,我们忽然意识到,sora其实是一个AI抖音。

群里也有朋友在调侃:真是没想到,下一个可能干掉tiktok的是openai。

当然,一旦到达了短视频平台领域,我们就要聊聊抖音成功的逻辑了:

用户激励 + 推荐算法

这两件事情,openai都做的好吗?确实未必。

因为有gpts和gpt agent两个失败的“珠玉在前”,我们有理由相信,openai没有什么做产品和应用的“基因”,那就更不要提重市场和运营的短视频平台了。

当然,话也不能说的太满,因为一个周活7亿的公司,早已不是一家简单的公司了;作为视频平台的冷启动,这个用户量级也已经绝对足够了。

我个人还是对sora作为短视频平台持悲观态度的。但sora作为一个技术,如果被社交巨头拿去了,那就是另一个故事了。。。

总之,让我们看看下面萌萌的大眼睛,那就是sora的图标。

它可真没有看上去的那么萌。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Sora2 AI视频生成 OpenAI 人工智能 视频技术 内容创作 AI短剧 商业广告 Cameos 分镜设计 AI伦理
相关文章