Sora 2发布：AI视频生成迈向模拟世界

原创小鹿 2025-10-01 17:44 吉林

家人们，放假第一天 OpenAI 就又给拽起来了，就在今天凌晨，OpenAI 宣布—Sora 2，来了！

在 2024 年 2 月，初版 Sora 亮相时，可以被称为 GPT-1 时刻，因为，Sora 首次向世界证明，AI 视频生成已不再是科幻～

而在这之后，OpenAI 一直在尝试让模型不只只是“生成画面”，而是真正地去“模拟世界”。

而今天，Sora 2 的发布标志着视频领域的 GPT-3.5 时刻的到来—AI 视频从新奇的“玩具”进化为强大的“工具”。

连 Sam Altman 本人都亲自下场盖章认证：

创意领域的 ChatGPT 时刻已经来临！
人类创造力即将迎来一次寒武纪大爆发，随之而来的艺术和娱乐质量，也将大幅提升。
突然间，创作天地变得无比开阔，令人印象非常深刻。

Altman 还和 Sora 团队的负责人 Bill Peebles 用 Sora 2 拍了一部用户官宣的视频：

Sora 2 这次的进化，最让人震撼的就是对物理世界的精准模拟。官方用了四个词来概括：运动 (motion)、物理 (physics)、智商 (IQ) 、身体力学 (body mechanics)。

这让生成的视频细节具有更高层次真实感，经得起推敲：

比如，滑板少年踢翻的工作，板子怎么翻、人怎么落地，都符合牛顿定律了，体操运动员在平衡木上的翻腾，不再是轻飘飘的贴图，而是充满了力量感和真实的物理碰撞。

AI 不再是“我觉得应该这样”，而是实现了“世界本该如此”。

看看这个物理现象模拟，非常惊艳：

此外，相较于前代，Sora 2 显著增强了模型的可控性。

在过去，用 AI 生成视频的时候，用户通常需要以“逐个镜头” (shot-by-shot) 的方式去创作，很难在一次生成中获得一个情节连贯的完整故事。

而 Sora 2 支持单次生成多个镜头，打破了过去用户受限于 shot-by-shot 的困境！

Sora2 最大的更新是原生的音画同步，不再是无声的画面生产模型，而是可以一步到位地创作出声画结合的完整作品。

官方指出可以 Sora2 生成的声音可以分为三类：

多语言对话：能够生成口型自然的多角色的对话

环境音效：生成风声、水声等各类逼真、仿生的环境音。

完整音景：创造出完整的音景 (soundscapes)，增添视频的沉浸感

互联网上提前拿到内测资格的网友们，已经晒出了很多 Sora 2 的表现，咱们可以一起品鉴下！

女子进行韵律体操

真实的滑板

不得不说，这些视频生成中对现实世界、现实规律的模拟有了质的飞跃，而且细节也明显更好更真实～

除了 Sora2，更让小鹿觉得 AI 视频又向前走一大步的一起发布的社交 App 应用-Sora！

第一眼看到 Sora App，感觉肯多家人也会觉得很熟悉：一个支持上下滑动的内容流、个人主页、关注系统……

（ps：只有我一个人觉得像抖音吗！！）

但它的内核却完全不同，这个平台上的所有内容，都是由 AI 生成的。

和抖音记录美好生活不一样，这个 App 是网络好友们想象力的集体狂欢。

本人也第一时间拿到内测码开测了！给大家看几个 Case：

这个 APP 因为有社交属性，你可以用自己的形象做视频也可以用开发授权的形象去做，那我首先先拿 OpenAI 的老大开玩梗！

1. 最简单的提示词- @Sam Altman Hug me：

提示词我写的非常敷衍，但是效果很惊艳，拥抱的细节和人脸的一致性非常好！激发了我的兴趣，那我接下来好好试试复杂的场景 Sora2 做的怎么样！

2. 让 Sam Altman 穿粉色小裙子唱跳：

（Ps：不许告我呜呜，是 Sam 你自己放出来授权给大家玩的！）

完整提示词： A high-energy, K-pop music video featuring Sam Altman as the star. He is wearing a sparkling, frilly, cute pink idol dress with ribbons.

3. 马里奥大战奥特曼：

完整提示词：High-speed, dynamic combat between Super Mario and Ultraman. Mario, agile and swift, uses a Cape Feather to fly and zip around Ultraman, performing rapid-fire Spin Jumps and throwing bouncing shells.

它不仅能做到多场景的无缝切换，运镜还相当专业，远景、中景、特写调度得行云流水。

但最关键的是，在这一切复杂的变换中，人物形象竟然能保持惊人的一致性和稳定性，动作细节也充满了物理上的真实感，简直了！

OpenAI 在 App 里面设定了两种玩法：

看到喜欢的视频时，可以一键“Remix”，用新的提示词在它的基础上进行二次创作。

社交推荐主要来自你社交圈（朋友、家人）的内容。

而且 Sora 还有一个概念级的功能—Cameo (客串)，将真实的你或者得到授权的朋友影像信息（样貌、声音、动作特征）无缝植入任何 AI 生成的虚拟场景中。

（刚才的 case 大玩特玩 Sam 就是用了这个功能！）

操作流程很短平快：

第一步：身份验证。在 App 里录制一小段带声音的视频，系统会通过“活性检查”（如根据指示移动头部）来确认是“你本人”，并采集你的形象特征。

第二步：开始穿越。在写提示词时，你只需要 @ 你自己 或 @ 你的朋友（需获得授权），这个“数字分身”就会像一个素材一样，被精准地“投放”到你创造的世界里。

讲真，这个概念非常有趣！但是，其实如果先进的玩法，有很多潜在的问题，那 OpenAI 设计了一套“安全网”：

身份验证与防盗用：创建 Cameo 必须经过真人验证流程。

精细的肖像权控制：你的 Cameo 谁能用，权限设置全部自己控制。

内容所有权与删除权：包含你 Cameo 的视频（即便是朋友做的），你都拥有共同所有权，并且有权随时删除。

目前，这个还仅在 iOS 系统提供，首发地区为美国和加拿大，后续会扩展。安卓版仍在开发中。

不得不感叹，科技的演进是真的不分节假日。

就在我们开启假期模式的第一天，OpenAI 就为全世界的创作者，送上了一份颠覆性的“假日大礼”。

Sora 2 的真实感和 Sora App 的社交玩法。第一次让我感觉到 AI 真的可以让我们亲身“踏入”的鲜活世界～

阅读原文

跳转微信打开

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签