IT之家 10月01日
Sora 2:OpenAI 新一代视频模型,带来逼真视听体验
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI 发布了其下一代视频生成模型 Sora 2,在拟真视频效果和音频生成能力上均有显著提升。新模型继承并扩展了早期图像生成技术,并推出配套 App,允许用户通过录制视频和语音进行身份验证,然后在生成的视频中“客串”。Sora App 提供个性化信息流和“可调节排序”功能。Sora 2 在物理规律表现上比初代模型更自然,并新增了语音生成。OpenAI 强调,尽管模型尚不完善,但大规模视频训练正逐步接近真实世界模拟。Sora App 已在 iOS 上架,采用邀请制,并将在美加地区逐步开放,初期提供较宽松的创作额度。商业模式暂定为在算力不足时提供付费额外视频生成选项。OpenAI 还发布了安全公告,强调视频将带有水印和元数据,用户肖像使用需经同意,并可随时撤销。青少年用户将受到家长控制和使用时长限制。系统防护措施将在生成阶段屏蔽不安全内容,并计划扩充人工审核团队。OpenAI 将 Sora 2 视为通往更强大 AI 系统的重要一步,预示着通用世界模拟器和机器人智能体的未来。

🌟 Sora 2 作为 OpenAI 的新一代视频生成模型,显著提升了视频的拟真度,并首次集成了音频生成能力,为用户带来更全面的视听体验。该模型在物理规律的模拟上更加自然流畅,解决了初代模型在动作表现上的僵硬问题。

📱 配套的 Sora 应用允许用户通过录制自己的视频和语音来验证身份,从而在生成的视频中“客串”自己或他人。应用采用了与社交媒体相似的算法推荐信息流,并提供“可调节排序”功能,让用户能够更个性化地定制内容。

🛡️ OpenAI 在安全方面采取了多项措施,包括为所有 Sora 视频添加水印和元数据标识,确保用户肖像的使用需获得本人同意且可随时撤销。同时,对青少年用户实施家长控制和时长限制,并在生成阶段屏蔽色情、恐怖主义宣传等不安全内容,并计划加强人工审核。

🚀 OpenAI 将 Sora 2 视为迈向更强大 AI 系统的重要里程碑,预示着通用世界模拟器和机器人智能体的发展潜力,有望重塑社会并加速人类发展进程。

IT之家 10 月 1 日消息,北京时间今天凌晨,OpenAI 发布了下一代视频生成模型 Sora 2。

这款新模型在拟真视频效果上有明显提升,并新增音频生成能力。其继承并扩展了早期的图像生成技术,在同期推出的新版 App 中,用户可以通过一次性录制自己的视频和语音来完成身份验证,然后在生成的视频中“客串”自己或他人。

Sora 应用与现有社交媒体相似,提供算法推荐的信息流,根据互动对象和兴趣推送个性化内容,并引入“可调节排序”功能,让用户进一步定制看到的内容。

Sora 2 延续了 2024 年 2 月发布的初代模型。相比初代在篮球反弹等动作上常常显得僵硬,新版本在物理规律表现上更自然

与上一代不同,Sora 2 还能生成语音。OpenAI 表示,虽然模型远未完善,仍有不少错误,但这验证了通过更大规模的视频训练,可以逐步接近真实世界的模拟

Sora 应用目前已在 iOS 上架,但采用邀请制,用户需通过应用申请资格。OpenAI 表示将率先在美国和加拿大逐步开放,并在初期给予用户较宽松的创作额度。但由于视频生成对算力要求极高,公司会限制使用,以保证服务稳定。

OpenAI 坦言,目前唯一的商业计划是在算力不足时,为有需求的用户提供付费生成额外视频的选项

为回应安全担忧,OpenAI 同步发布了一份博客说明。据IT之家了解,公司强调,所有 Sora 视频都会带有水印和元数据标识,用户的肖像只能在本人同意下使用,并可随时撤销。青少年用户账号会受到家长控制和使用时长限制。

系统的防护措施会在生成阶段就尝试屏蔽不安全内容,包括色情、恐怖主义宣传和自残相关内容,并通过多帧画面和音频检测进行拦截。OpenAI 还计划扩充人工审核团队,重点审查可能涉及霸凌的视频。

OpenAI 将 Sora 2 描述为通往更强大 AI 系统的重要一步。公司表示:“视频模型正在飞速进化。通用世界模拟器和机器人智能体将重塑社会,加速人类的发展进程。”

相关阅读:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Sora 2 OpenAI 视频生成 AI 人工智能 Sora App AI 安全 视听模型
相关文章