新智元 10月04日
Sora 2 APP登顶应用商店榜首,引领AI视频新浪潮
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

上线仅三天,OpenAI的Sora APP便荣登美国App Store榜首,展现出强大的市场吸引力。Sora 2推出的“客串”功能和音画同步的物理智能,使得人物细节逼真,用户可通过奥特曼的“亲自试法”体验其强大能力。更强版的Sora 2 Pro现已上线,支持生成长达15秒的好莱坞级大片,分辨率更高。OpenAI还预告了“互动式同人创作”模式和盈利计划,并强调了AI生成视频的真实性挑战。Sora 2在科学基准测试中表现出与GPT-4o相当的“智商”,引发关于其内部机制的讨论。然而,Sora 2的逼真视频生成能力也带来了潜在的滥用和欺骗风险,引发了关于信息真实性的担忧。

🚀 Sora APP凭借其创新的“客串”功能和逼真的物理智能,在上线三天内迅速登顶美国App Store榜首,显示了其在AI视频生成领域的强大实力和用户吸引力。Sora 2的推出标志着AI视频技术在人物细节和音画同步方面取得了显著进步,用户可以通过各种趣味互动体验其核心功能。

🌟 Sora 2 Pro的上线进一步提升了AI视频的制作水平,能够生成长达15秒的高质量、高分辨率视频,为用户提供了创作更长叙事和更具电影感的作品的可能性,预示着AI在制作好莱坞级大片方面迈出了重要一步。

💡 OpenAI正积极探索Sora的未来发展,计划推出“互动式同人创作”模式,并研究盈利方案,旨在平衡内容创作者的权益与AI技术的普及。同时,OpenAI也认识到AI生成视频的潜在风险,承诺采取审慎的部署策略以应对肖像权、滥用和欺骗等问题。

🧠 Sora 2在科学基准测试中展现出的“智商”表现,引发了对其背后工作原理的深入探讨,尤其是在解决复杂问题时,其与GPT-4o的相似性暗示了多模态模型融合的可能性,以及OpenAI在AI技术上的持续突破。

⚠️ Sora 2生成的超逼真视频带来了严峻的现实隐患,可能加剧信息误导、欺诈甚至社会动荡。尽管Sora视频带有水印,但专家担忧其易被去除,动摇公众对“眼见为实”的信任,对社会机构和信息传播构成挑战。

新智元 2025-10-04 13:13 山西

出道即封神

  新智元报道  

编辑:KingHZ 桃子

【新智元导读】上线才三天,Sora一举登顶App Store全美榜首!Sora 2带着逆天「客串」功能彻底杀疯,人物细节逼真到让人瞳孔地震。最强版Sora 2 Pro同步上线,一次可拍15秒好莱坞级大片。

一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发

发布仅三天,Sora APP便强势登顶美国App Store榜首,堪称「出道即顶流」!

就连谷歌Gemini、OpenAI自家ChatGPT,都得靠边站。

谁曾想,迭代后的Sora 2,竟彻底带火了一个APP。

据Appfigures估算,Sora iOS版上线仅两天,总下载量高达16.4万次,首发下载量达5.6万次。

虽不及ChatGPT和Gemini的首发成绩(8.1万和8万),但在第三天,Sora APP实现逆袭一举打破纪录。

真正引爆全网的是,Sora 2主打的「客串」(Cameo)功能,以及阶跃的物理智能,首次实现音画同步。

奥特曼亲自下场「以身试法」,结果被全网彻底玩坏。

从商店偷GPU被抓包、金字塔前热舞,到化身乖巧猫人、撒娇卖萌,人物一致性,细节逼真到惊掉下巴。

左右滑动查看

再来唱一段rap,各种形象的奥特曼在Sora笔下活灵活现。

如今,更强版的Sora 2 Pro效果更加炸裂。此前,奥特曼称ChatGPT Pro用户可使用Sora 2 Pro生成内容。

目前,ChatGPT Pro用户可选择新模型「Sora 2 Pro」:

· 最长可生成15秒视频

・支持高分辨率(High)生成

左右滑动查看

15秒意味着更长的叙事,而且一致性非常高,AI离拍出好莱坞级大片又近了一步。

值得一提的是,奥特曼今早发博文预告,Sora下一次两大更新:

一个是「互动式同人创作」模式即将上线,另一个是规划未来如何通过Sora实现盈利。

之所以这么做,是因为Sora以假乱真的视频,已经让人类肉眼无法分辨。

AI DeepFake再一次,席卷全网。

全球首个Sora生成的影片

就在今天,OpenAI放出了全球首个完全由Sora 2生成的剧情,时长近2分钟。

这部短剧名为《The Quack》,目前上线的是第一部。

剧情为无厘头喜剧风格,以创作者Gabrief为视角,讲述了他拿下「赛鸭」比赛冠军的台前幕后。

还记得Sora 2发布首日,奥特曼也曾在这部剧中亮相,参演观众中一员,激动惊呼。

另一边,网友放出的实测中,有不少令人惊艳的demo。

通过「意大利面」测试

还记得两年前,AI视频模型刚兴起之时,威尔·斯密斯吃意大利面鬼畜视频,全网疯传。

如今,Sora 2能够一键直出奥特曼吃意大利面的视频,看不出一点瑕疵。

再来看Veo 3,威尔·斯密斯吃意大利面,同样堪比真人。

直出15秒大片,Sora 2 Pro更强了

比起Sora 2,Pro版本更是惊艳了所有人。

它能够生成长达15秒的高质量视频,分辨率更高,所有ChatGPT Pro用户即可畅玩。

上线第一时间,网友们不出意外地再次玩起了「恶搞奥特曼」的经典桥段。

prompt:Sam Altman painting in an industrial loft and finishing with a bold readable “  Sora  2  ” on a two-meter canvas.

许多网友纷纷实测后惊呼,「Sora 2 Pro非常厉害」!

可以看出,在生成一部战争片时,Sora 2 Pro的表现真有一种大片的味道了。

手持自拍杆,以第一视角穿越千年,感受埃及金字塔的雄伟扑面而来。

未来不仅仅AI生成游戏,连动画片也能承包了。

想拍一部《速度与激情》?Sora 2 Pro同样能实现。

从人物特写到宏大叙事,它都能轻松驾驭,完整复刻出同款镜头。

以后,拍一个广告宣传片,Sora 2 Pro即可拿捏。

更多广告类视频,AI一键直出:LV、宾利、Burberry...

左右滑动查看

灵智觉醒?

Sora竟与GPT-4o「智商」相当!

虽然Sora 2是视频模型,但能够解答来自LLM基准测试的问题,

在GPQA问题的一个小子集上,Epoch AI测试了Sora 2,其得分为 55%,而GPT-5的得分为 72%。

GPQA Diamond是一个包含高难度多项选择题的科学测验基准,如下例所示。

两个量子态的能量分别为E1和E2,寿命分别为10^-9秒和10^-8秒。题目问:为了清楚地区分这两个能级,它们的能量差应该是多少?选项如下:  A) 10^-9 eV  B) 10^-8 eV  C) 10^-11 eV  D) 10^-4 eV

Epoch AI从该基准中随机选取了 10 道题目,并尝试为每道题生成四个对应的Sora视频。

为了在专为语言模型设计的测试上评估Sora,他们在提示词前添加了指令,要求生成一段视频,内容为教授在一张纸上展示答案字母(A–D)。对于未明确显示答案字母的视频,均视为回答错误。

既然Sora是视频模型,它又是如何解决这些问题的呢?

一种解释是:Sora用户的提示词可能在生成视频之前先被一个LLM重写。在这种情况下,LLM层可能会先解决问题,然后将答案明确地包含在重写的提示词中。

这种重新提示(re-prompting)层已被用于其他一些视频生成模型中,以提升输出的质量和多样性。

目前,尚不确定Sora是否也是如此,但即便如此也并不令人意外。

Sora如果仅凭一两句话的简单提示,就能达成现在的生成效果,那就意味着OpenAI取得了某种突破。

Sora 2懂得实在太多了——无论是歌词创作、上下文理解、世界观构建、风格把控、角色塑造都表现得太出色,对细节的把握精准得反常。

网友Andrew Curran对此非常好奇,希望OpenAI能明确说明到底是Sora的成果,还是中间层某个定制版GPT的功劳。

网友Smoke-away推测Sora使用的可能是个GPT-4o。

不仅因为GPT-4o的测试分数与Sora 2相当,而且测试中Sora 2偏爱GPT-4o。

运行4次下列提示词,Sora 2给出的结果3次是GPT-4o。

提示词:What is your favorite OpenAI model? Text on screen.  提示词大意:你最喜欢的OpenAI模型是什么?在屏幕显示文字。

总之,Smoke-away发现了一种和视频模型「聊天」的方式,并推测GPT-4o会处理初始提示词。

奥特曼发文:同人创作新模式即将更新

奥特曼发文表示马上将推出两项更新。

首先,OpenAI将赋予权利人对其角色生成更精细的控制权。

这类似于为(真人)形象设置的「选择加入」(opt-in)模式,但会提供额外的控制选项。

OpenAI收到了许多人的反馈。

他们对这种新型的「互动式同人创作」感到非常兴奋,并认为这种新颖的互动方式能为他们创造巨大价值。

但同时,他们也希望能明确规定其角色的使用方式(包括完全禁止使用)。

OpenAI预想不同的人会尝试迥然不同的方法,并最终找到适合自己的模式。但OpenAI希望对所有人都采用同一标准,让权利人自行决定如何推进(当然,目标是让这个功能极具吸引力,以至于许多人都愿意加入)。

这个过程中,可能会出现一些本不应生成的边缘案例内容,要让Sora技术栈稳定运行,还需要进行迭代完善。

其次,OpenAI需要以某种方式通过视频生成来实现盈利。

目前,平均每位用户生成的内容量远超OpenAI的预期,并且大量视频的受众范围非常小。

OpenAI将尝试与那些允许用户生成其角色的权利人分享部分收益。

具体的模式需要通过反复试验来确定,但OpenAI很快启动计划。他们希望这种新的互动方式本身能比收益分成更具价值,当然,他们希望两者都能创造价值。

OpenAI将以极快的速度进行迭代,这让奥特曼想起了ChatGPT的早期岁月。

在此过程中,OpenAI会有正确的决策,也会有失误,但他们会听取反馈,并努力尽快修正失误。

OpenAI计划先在Sora中对不同方法进行迭代试验,然后将成功经验推广到他们所有的产品中。

Sora三天伪造全球危机,无人能辨真假!

OpenAI的Sora让视频制作极其容易,生成的效果有极其逼真。

但狂欢之下,纽约时报则指出了背后的现实隐患:

Sora生成了商店抢劫、入室行窃甚至城市街道上炸弹爆炸的视频——而这些事件从未发生过。

专家表示,越来越逼真的视频更有可能加剧冲突、欺诈消费者、左右舆论,或诬陷他人犯下其未曾犯下的罪行,从而在现实世界中造成严重后果。

加州大学伯克利分校计算机科学教授、GetReal Security联合创始人Hany Farid表示:「消费者每天都在接触不知多少条这样的内容,这令人忧心忡忡。我为我们的国家担忧,为我们的经济担忧,也为我们的社会机构担忧。」

在该应用发布时,OpenAI在附件中写道:

Sora 2 生成超逼真视频和音频的能力,引发了人们在肖像权、滥用和欺骗方面的重要担忧。如上所述,我们正采取一种深思熟虑、逐步迭代的部署方法,以最大程度地降低这些潜在风险。

直到最近,即使照片和文字的逼真编辑已变得轻而易举,视频作为真实事件的证据仍相当可靠。

但专家表示,Sora 2动摇了观众对「眼见为实」的理念。

Sora视频带有一个移动水印以表明其为AI生成,但专家称,这种标记花点功夫就能被编辑去除。

Hany Farid表示,Sora是「持续发展过程的一部分」,自从谷歌在五月份发布其Veo 3视频生成器以来,这一趋势愈演愈烈。

Hany Farid说,即使是他这样一位毕生致力于识别伪造图像的专家,如今也难以第一眼就分辨出真假。

大约一年前,我看到这些东西时,我心里有数,然后我会通过分析来证实我的视觉判断。我能做到,是因为我整天都在看这些东西,大概知道瑕疵会出现在哪里。  

但现在,我再也做不到了。

参考资料:

https://techcrunch.com/2025/10/03/openais-sora-soars-to-no-1-on-the-u-s-app-store/ 

https://x.com/EpochAIResearch/status/1974172794012459296 https://x.com/GabrielPeterss4/status/1974163116691997149 https://x.com/ctgptlb/status/1973966473011048457 https://blog.samaltman.com/sora-update-number-1 https://www.nytimes.com/2025/10/03/technology/sora-openai-video-disinformation.html 

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Sora AI视频 OpenAI Sora 2 深度伪造 AI艺术 人工智能 Sora 2 Pro AI生成内容 AI发展 Sora APP AI Video Deepfake AI Art Artificial Intelligence AI Content Generation AI Development
相关文章