新智元 10月16日 19:32
谷歌更新视频生成模型Veo 3.1,提升叙事与控制力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌发布的Veo 3.1是其旗舰视频生成模型的最新升级,重点在于增强叙事能力和音频控制。此次更新引入了“导演级”精控功能,让AI能更深入理解故事,并生成具有电影质感的视频。Veo 3.1支持首尾帧控制、多图参考合成场景,并能实现音画同步,生成片段最长可达148秒,规格支持1080p/24fps。该模型已接入Gemini API和Vertex AI,用户可在Flow或Gemini中体验。Flow作为一款AI电影制作工具,已驱动生成超过2.75亿个视频,并新增了剪辑编辑功能。尽管Veo 3.1在真实感和细节处理上仍有提升空间,但其在叙事连贯性和多元素整合方面展现了显著进步,预示着AI视频生成技术的进一步发展。

🎬 Veo 3.1在叙事和音频控制方面实现重大突破,AI能更深入理解故事,生成更具电影感的视频。新增的首尾帧和多图参考功能,使得用户能够更精确地控制视频的开端、结尾以及场景元素的组合,实现“导演级”的精细化创作。

🌟 模型支持生成包含多人物、多物体场景的视频,并能实现音画同步,显著提升了视频的真实感和沉浸感。最长可达148秒的视频片段,以及1080p/24fps的规格,为高质量内容创作奠定了基础。

🚀 Veo 3.1已接入Gemini API和Vertex AI,用户可通过Flow或Gemini平台进行体验。Flow作为一款AI电影制作工具,已积累了庞大的用户基础和创作量,此次更新进一步增强了其编辑和创意能力,为用户提供了更便捷高效的创作流程。

新智元 2025-10-16 10:31 北京

  新智元报道  

编辑:定慧

【新智元导读】谷歌凌晨更新Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入Gemini API与Vertex AI,Flow与Gemini可用。可合成多人物场景、音画同步,片段最长约148秒;规格至1080p/24fps。

刚刚,谷歌在今天凌晨更新了旗舰视频生成模型Veo 3.1。

此次更新主要有两大功能亮点:

更强的叙事与音频控制

更丰富的输入与编辑能力

这次升级让AI对想讲述的故事能有更深的理解。

Veo 3.1让AI视频生成迈入「导演级」精控阶段。

真实与叙事感升级,更高画质与音画同步,让视频更具电影质感。

Veo 3.1目前已接入Gemini API与Vertex AI。

普通用户也可以直接在Flow或者Gemini中体验。

Flow使用方式如下,新建项目后即可使用。

Gemini可选择创建Video,即可使用Veo 3.1。

我们使用「威尔斯吃面」极简提示词测试了一下效果,确实已经非常流畅和自然。

对于首尾帧生成,我们也进行了测试,提示词为「奥特曼最后像钢铁侠一样飞走」。

效果也非常好。

Veo 3.1可以将不同人物和物体的照片合成一个完整的场景,并配有声音。

还能创建更长的片段,甚至持续一分钟或更久,延续原始镜头中的动作。

每个生成的视频都基于前一个片段的最后一秒,以帮助延续故事,并保持背景和人物的一致性。

只需提供第一帧和最后一帧,Veo就会让整个场景栩栩如生,创建带有宏大转场的无缝视频。

强推使用Flow来使用和体验Veo 3.1!

5个月前,谷歌正式推出Flow,一款由Veo驱动的AI电影制作工具。

目前,谷歌宣称用户已在Flow中生成了超过2.75亿个视频!

此次Veo 3.1的更新,推出了用于剪辑编辑的新功能和增强创意能力。

Flow还有一个Flow TV的功能,像一个电视台一样,可以不断地换台,观看其他用户生成的创意视频。

Flow TV工作台可以通过工作台进行切换。

Flow将2.5亿个视频,分成了不同的频道。

比如碰撞测试、打招呼、感到可爱。。。等等。

而Short Films则是用户制作的微电影,制作更加精良,时间更长。

目前只放出了3部。

比如下面这部名为「FreeLancers」,讲述了这样一个故事:

在纽约一家秘密餐厅的晚餐中,两位久疏音信的养兄弟——一位做事谨慎、另一位喧闹且卤莽——回忆起他们作为国际杀手的职业生涯,直到他们意识到两人竟被雇佣去执行同一项任务:对方。

「FreeLancers」电影级别视频如下,电影质感非常高。

Veo 3.1技术规格上支持输出720p或1080p分辨率的视频,帧率为24帧/秒(fps)。

视频时长可选4秒、6秒或8秒,若使用Extend功能,视频最长可扩展至148秒。

各位觉得Veo 3.1的效果能不能打过Sora 2呢?

这次的Veo 3.1更像「功能小升级」——新增首尾帧、多图参考等控制。

但成片质感较Veo 3进步有限,甚至略微显得有点「假」。

原生时长仍只有8秒,Flow延长至30秒画面偶有衔接,音频提升其实很一般。

基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。

但这个只是Veo 3->Veo 3.1的一次微调。

期待一下谷歌年底的大招,估计会配合Gemini 3全家桶发布。

参考资料:

https://x.com/GoogleDeepMind/status/1978491999029219364

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Veo 3.1 谷歌 AI视频生成 Gemini Flow
相关文章