原创 小鹿 2025-10-01 17:44 吉林
家人们,放假第一天 OpenAI 就又给拽起来了,就在今天凌晨,OpenAI 宣布—Sora 2,来了!
在 2024 年 2 月,初版 Sora 亮相时,可以被称为 GPT-1 时刻,因为,Sora 首次向世界证明,AI 视频生成已不再是科幻 ~
而在这之后,OpenAI 一直在尝试让模型不只只是“生成画面”,而是真正地去“模拟世界”。
而今天,Sora 2 的发布标志着视频领域的 GPT-3.5 时刻的到来—AI 视频从新奇的“玩具”进化为强大的“工具”。
连 Sam Altman 本人都亲自下场盖章认证:
创意领域的 ChatGPT 时刻已经来临!
人类创造力即将迎来一次寒武纪大爆发,随之而来的艺术和娱乐质量,也将大幅提升。
突然间,创作天地变得无比开阔,令人印象非常深刻。
Altman 还和 Sora 团队的负责人 Bill Peebles 用 Sora 2 拍了一部用户官宣的视频:
Sora 2 这次的进化,最让人震撼的就是对物理世界的精准模拟。官方用了四个词来概括:运动 (motion)、物理 (physics)、智商 (IQ) 、身体力学 (body mechanics)。
这让生成的视频细节具有更高层次真实感,经得起推敲:
比如,滑板少年踢翻的工作,板子怎么翻、人怎么落地,都符合牛顿定律了,体操运动员在平衡木上的翻腾,不再是轻飘飘的贴图,而是充满了力量感和真实的物理碰撞。
AI 不再是“我觉得应该这样”,而是实现了“世界本该如此”。
看看这个物理现象模拟,非常惊艳:
此外,相较于前代,Sora 2 显著增强了模型的可控性。
在过去,用 AI 生成视频的时候,用户通常需要以“逐个镜头” (shot-by-shot) 的方式去创作,很难在一次生成中获得一个情节连贯的完整故事。
而 Sora 2 支持单次生成多个镜头,打破了过去用户受限于 shot-by-shot 的困境!
Sora2 最大的更新是原生的音画同步,不再是无声的画面生产模型,而是可以一步到位地创作出声画结合的完整作品。
官方指出可以 Sora2 生成的声音可以分为三类:
多语言对话:能够生成口型自然的多角色的对话
环境音效:生成风声、水声等各类逼真、仿生的环境音。
完整音景:创造出完整的音景 (soundscapes),增添视频的沉浸感
互联网上提前拿到内测资格的网友们,已经晒出了很多 Sora 2 的表现,咱们可以一起品鉴下!
女子进行韵律体操
真实的滑板
不得不说,这些视频生成中对现实世界、现实规律的模拟有了质的飞跃,而且细节也明显更好更真实 ~
除了 Sora2,更让小鹿觉得 AI 视频又向前走一大步的一起发布的社交 App 应用-Sora!
第一眼看到 Sora App,感觉肯多家人也会觉得很熟悉:一个支持上下滑动的内容流、个人主页、关注系统……
(ps:只有我一个人觉得像抖音吗!!)
但它的内核却完全不同,这个平台上的所有内容,都是由 AI 生成的。
和抖音记录美好生活不一样,这个 App 是网络好友们想象力的集体狂欢。
本人也第一时间拿到内测码开测了!给大家看几个 Case:
这个 APP 因为有社交属性,你可以用自己的形象做视频也可以用开发授权的形象去做,那我首先先拿 OpenAI 的老大开玩梗!
1. 最简单的提示词- @Sam Altman Hug me:
提示词我写的非常敷衍,但是效果很惊艳,拥抱的细节和人脸的一致性非常好!激发了我的兴趣,那我接下来好好试试复杂的场景 Sora2 做的怎么样!
2. 让 Sam Altman 穿粉色小裙子唱跳:
(Ps:不许告我呜呜,是 Sam 你自己放出来授权给大家玩的!)
完整提示词: A high-energy, K-pop music video featuring Sam Altman as the star. He is wearing a sparkling, frilly, cute pink idol dress with ribbons.
3. 马里奥大战奥特曼:
完整提示词:High-speed, dynamic combat between Super Mario and Ultraman. Mario, agile and swift, uses a Cape Feather to fly and zip around Ultraman, performing rapid-fire Spin Jumps and throwing bouncing shells.
它不仅能做到多场景的无缝切换,运镜还相当专业,远景、中景、特写调度得行云流水。
但最关键的是,在这一切复杂的变换中,人物形象竟然能保持惊人的一致性和稳定性,动作细节也充满了物理上的真实感,简直了!
OpenAI 在 App 里面设定了两种玩法:
看到喜欢的视频时,可以一键“Remix”,用新的提示词在它的基础上进行二次创作。
社交推荐主要来自你社交圈(朋友、家人)的内容。
而且 Sora 还有一个概念级的功能—Cameo (客串),将真实的你或者得到授权的朋友影像信息(样貌、声音、动作特征)无缝植入任何 AI 生成的虚拟场景中。
(刚才的 case 大玩特玩 Sam 就是用了这个功能!)
操作流程很短平快:
第一步:身份验证。在 App 里录制一小段带声音的视频,系统会通过“活性检查”(如根据指示移动头部)来确认是“你本人”,并采集你的形象特征。
第二步:开始穿越。在写提示词时,你只需要 @ 你自己 或 @ 你的朋友(需获得授权),这个“数字分身”就会像一个素材一样,被精准地“投放”到你创造的世界里。
讲真,这个概念非常有趣!但是,其实如果先进的玩法,有很多潜在的问题,那 OpenAI 设计了一套“安全网”:
身份验证与防盗用:创建 Cameo 必须经过真人验证流程。
精细的肖像权控制:你的 Cameo 谁能用,权限设置全部自己控制。
内容所有权与删除权:包含你 Cameo 的视频(即便是朋友做的),你都拥有共同所有权,并且有权随时删除。
目前,这个还仅在 iOS 系统提供,首发地区为美国和加拿大,后续会扩展。安卓版仍在开发中。
不得不感叹,科技的演进是真的不分节假日。
就在我们开启假期模式的第一天,OpenAI 就为全世界的创作者,送上了一份颠覆性的“假日大礼”。
Sora 2 的真实感和 Sora App 的社交玩法。第一次让我感觉到 AI 真的可以让我们亲身“踏入”的鲜活世界 ~
