夕小瑶科技说 10月02日
Sora 2发布:AI视频生成迈向模拟世界
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI发布Sora 2,标志着AI视频生成从新奇玩具进化为强大工具。新模型在物理世界模拟方面取得重大突破,精确还原运动、物理、智商和身体力学,使生成视频更具真实感。Sora 2还显著增强了可控性,支持一次生成多镜头并实现原生的音画同步,包括多语言对话、环境音效和完整音景。同时发布的Sora App则是一个由AI生成内容组成的社交平台,用户可进行二次创作和将个人形象植入虚拟场景,开启AI创作的新篇章。

🌟 Sora 2的发布标志着AI视频生成进入“模拟世界”的新阶段,不再局限于生成画面,而是能够更精准地模拟物理世界的运动、物理规律、智商和身体力学,使得生成的视频细节更加真实可信,例如滑板少年落地和体操运动员的动作都符合物理定律。

🚀 Sora 2显著提升了模型的可控性,支持一次性生成多个镜头,打破了以往逐个镜头创作的限制,使得用户能够更便捷地创作情节连贯的完整故事。同时,它实现了原生的音画同步,能够一步到位地生成包含多语言对话、环境音效和完整音景的声画结合作品,极大地增强了视频的沉浸感。

📱 随Sora 2一同发布的Sora App是一个创新的社交平台,所有内容均由AI生成。用户可以通过“Remix”功能在现有视频基础上进行二次创作,并利用“Cameo”功能将个人或授权的数字分身无缝植入AI生成的虚拟场景中,实现与AI内容的深度互动。该App还内置了身份验证和肖像权控制等安全机制,保障用户隐私。

💡 Sora App的Cameo功能允许用户录制一段包含声音的视频进行身份验证,系统会采集形象特征,并可在创建提示词时调用“数字分身”,实现高度个性化的AI视频创作。此功能为用户提供了极大的创作自由,但也伴随着严格的安全和隐私保护措施。

原创 小鹿 2025-10-01 17:44 吉林

家人们,放假第一天 OpenAI 就又给拽起来了,就在今天凌晨,OpenAI 宣布—Sora 2,来了!

在 2024 年 2 月,初版 Sora 亮相时,可以被称为 GPT-1 时刻,因为,Sora 首次向世界证明,AI 视频生成已不再是科幻 ~

而在这之后,OpenAI 一直在尝试让模型不只只是“生成画面”,而是真正地去“模拟世界”。

而今天,Sora 2 的发布标志着视频领域的 GPT-3.5 时刻的到来—AI 视频从新奇的“玩具”进化为强大的“工具”。

连 Sam Altman 本人都亲自下场盖章认证:

创意领域的 ChatGPT 时刻已经来临!
人类创造力即将迎来一次寒武纪大爆发,随之而来的艺术和娱乐质量,也将大幅提升。
突然间,创作天地变得无比开阔,令人印象非常深刻。

Altman 还和 Sora 团队的负责人 Bill Peebles 用 Sora 2 拍了一部用户官宣的视频:

Sora 2 这次的进化,最让人震撼的就是对物理世界的精准模拟。官方用了四个词来概括:运动 (motion)、物理 (physics)、智商 (IQ) 、身体力学 (body mechanics)。

这让生成的视频细节具有更高层次真实感,经得起推敲:

比如,滑板少年踢翻的工作,板子怎么翻、人怎么落地,都符合牛顿定律了,体操运动员在平衡木上的翻腾,不再是轻飘飘的贴图,而是充满了力量感和真实的物理碰撞。

AI 不再是“我觉得应该这样”,而是实现了“世界本该如此”。

看看这个物理现象模拟,非常惊艳:

此外,相较于前代,Sora 2 显著增强了模型的可控性。

在过去,用 AI 生成视频的时候,用户通常需要以“逐个镜头” (shot-by-shot) 的方式去创作,很难在一次生成中获得一个情节连贯的完整故事。

而 Sora 2 支持单次生成多个镜头,打破了过去用户受限于 shot-by-shot 的困境!

Sora2 最大的更新是原生的音画同步,不再是无声的画面生产模型,而是可以一步到位地创作出声画结合的完整作品。

官方指出可以 Sora2 生成的声音可以分为三类:

    多语言对话:能够生成口型自然的多角色的对话

    环境音效:生成风声、水声等各类逼真、仿生的环境音。

    完整音景:创造出完整的音景 (soundscapes),增添视频的沉浸感

互联网上提前拿到内测资格的网友们,已经晒出了很多 Sora 2 的表现,咱们可以一起品鉴下!

女子进行韵律体操

真实的滑板

不得不说,这些视频生成中对现实世界、现实规律的模拟有了质的飞跃,而且细节也明显更好更真实 ~

除了 Sora2,更让小鹿觉得 AI 视频又向前走一大步的一起发布的社交 App 应用-Sora!

第一眼看到 Sora App,感觉肯多家人也会觉得很熟悉:一个支持上下滑动的内容流、个人主页、关注系统……

(ps:只有我一个人觉得像抖音吗!!)

但它的内核却完全不同,这个平台上的所有内容,都是由 AI 生成的。

和抖音记录美好生活不一样,这个 App 是网络好友们想象力的集体狂欢。

本人也第一时间拿到内测码开测了!给大家看几个 Case:

这个 APP 因为有社交属性,你可以用自己的形象做视频也可以用开发授权的形象去做,那我首先先拿 OpenAI 的老大开玩梗!

1. 最简单的提示词- @Sam Altman Hug me:

提示词我写的非常敷衍,但是效果很惊艳,拥抱的细节和人脸的一致性非常好!激发了我的兴趣,那我接下来好好试试复杂的场景 Sora2 做的怎么样!

2. 让 Sam Altman 穿粉色小裙子唱跳:

(Ps:不许告我呜呜,是 Sam 你自己放出来授权给大家玩的!)

完整提示词: A high-energy, K-pop music video featuring Sam Altman as the star. He is wearing a sparkling, frilly, cute pink idol dress with ribbons.

3. 马里奥大战奥特曼:

完整提示词:High-speed, dynamic combat between Super Mario and Ultraman. Mario, agile and swift, uses a Cape Feather to fly and zip around Ultraman, performing rapid-fire Spin Jumps and throwing bouncing shells. 

它不仅能做到多场景的无缝切换,运镜还相当专业,远景、中景、特写调度得行云流水。

但最关键的是,在这一切复杂的变换中,人物形象竟然能保持惊人的一致性和稳定性,动作细节也充满了物理上的真实感,简直了!

OpenAI 在 App 里面设定了两种玩法:

    看到喜欢的视频时,可以一键“Remix”,用新的提示词在它的基础上进行二次创作。

    社交推荐主要来自你社交圈(朋友、家人)的内容。

而且 Sora 还有一个概念级的功能—Cameo (客串),将真实的你或者得到授权的朋友影像信息(样貌、声音、动作特征)无缝植入任何 AI 生成的虚拟场景中。

(刚才的 case 大玩特玩 Sam 就是用了这个功能!)

操作流程很短平快:

    第一步:身份验证。在 App 里录制一小段带声音的视频,系统会通过“活性检查”(如根据指示移动头部)来确认是“你本人”,并采集你的形象特征。

    第二步:开始穿越。在写提示词时,你只需要 @ 你自己 或 @ 你的朋友需获得授权),这个“数字分身”就会像一个素材一样,被精准地“投放”到你创造的世界里。

讲真,这个概念非常有趣!但是,其实如果先进的玩法,有很多潜在的问题,那 OpenAI 设计了一套“安全网”:

    身份验证与防盗用:创建 Cameo 必须经过真人验证流程。

    精细的肖像权控制:你的 Cameo 谁能用,权限设置全部自己控制。

    内容所有权与删除权:包含你 Cameo 的视频(即便是朋友做的),你都拥有共同所有权,并且有权随时删除。

目前,这个还仅在 iOS 系统提供,首发地区为美国和加拿大,后续会扩展。安卓版仍在开发中。

不得不感叹,科技的演进是真的不分节假日。

就在我们开启假期模式的第一天,OpenAI 就为全世界的创作者,送上了一份颠覆性的“假日大礼”。

Sora 2 的真实感和 Sora App 的社交玩法。第一次让我感觉到 AI 真的可以让我们亲身“踏入”的鲜活世界 ~

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Sora 2 OpenAI AI视频生成 Sora App 人工智能 数字分身 AI video generation Artificial Intelligence Digital Avatar
相关文章