cnBeta全文版 10月07日
OpenAI发布GPT-5 Pro、Sora 2及新语音模型,吸引开发者
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI在开发者日活动中公布了一系列重大API更新,包括推出最新的GPT-5 Pro语言模型、新视频生成模型Sora 2,以及一款更精简且价格更低的语音模型。这些举措旨在吸引更多开发者加入OpenAI生态系统,通过上线的“AgentKit”工具和ChatGPT内创建应用程序的新能力,为AI代理开发者提供支持。GPT-5 Pro将满足金融、法律、医疗等领域对高准确度和深度推理的需求。同时,新版“gpt-realtime mini”语音模型以更低成本提供同等高质量的语音交互体验。Sora 2模型现已通过API预览版提供给开发者,其在视频生成方面实现了更逼真、物理一致性更强的场景表现,声音画面高度同步,并支持更精细的创意控制,有望成为概念开发和内容创作的强大工具。

🚀 OpenAI重磅发布GPT-5 Pro,定位为满足金融、法律、医疗等行业对高准确度和深度推理的严苛需求,旨在吸引更多专业领域开发者。

🎬 全新视频生成模型Sora 2现已通过API预览版提供给开发者,其在真实感、物理一致性、音画同步及创意控制方面均有显著提升,支持从细致镜头调度到风格化视觉的广泛应用,将助力概念开发和内容创作。

🗣️ OpenAI推出了更精简、价格更低的“gpt-realtime mini”语音模型,以30%的成本提供与高阶模型相当的语音质量和表现力,并支持低延迟音频流式互动,凸显了语音交互在AI互动中的重要性。

🛠️ 为进一步吸引开发者,OpenAI上线了面向AI代理开发者的“AgentKit”工具,并开放了在ChatGPT内创建应用程序的新能力,构建更完善的开发者生态系统。

OpenAI于周一的开发者日(Dev Day)发布多项API更新,正式推出其最新语言模型GPT-5 Pro、新视频生成模型Sora 2,以及一款更精简、价格更低的语音模型。

这一系列举措旨在进一步吸引开发者加入OpenAI生态,包括上线面向AI代理开发者的“AgentKit”工具,以及允许在ChatGPT内创建应用程序的新能力。

OpenAI首席执行官Sam Altman表示,GPT-5 Pro的到来将吸引在金融、法律和医疗等领域需要“高准确度及深度推理”的开发者。Altman还强调,语音交互正迅速成为人们与AI互动的主要方式,因此OpenAI此次面向API推出了新版“gpt-realtime mini”语音模型。这一新模型不仅更小巧、成本更低(仅为此前高阶语音模型的30%价格),却仍保持“同等语音质量与表现力”,并支持低延迟的音频流式互动。

此外,OpenAI开发者生态的创作者们现在可以通过API预览版接入Sora 2。OpenAI上周发布了新一代音视频生成器Sora 2及配套“类TikTok”短视频应用Sora。使用者可以基于提示词生成自己或朋友的短视频,并通过算法推荐的动态流进行分享。

Altman表示:“开发者们现在可以在自己的应用程序中,使用与Sora 2同源的高品质视频生成模型。”Sora 2相较前代产品,具备更逼真、物理一致性更强的场景表现,声音与画面同步、创意控制力显著提升——涵盖了从细致的镜头调度到风格化视觉的全新能力。例如,用户可以将手机视野扩展为“电影级广角”,并体验影像与环境音效、氛围音、同步效果高度契合的动态视听体验。

Sora 2被定位为概念开发利器,可用于广告初稿创意,也可实现诸如玩具设计者将草图变为产品概念等应用。Altman举例指出,这正是OpenAI携手芭比制造商美泰,将生成式AI引入玩具设计和内容创作幕后流程的典型场景。

查看评论

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI GPT-5 Pro Sora 2 AI 开发者工具 语音模型 API更新
相关文章