谷歌更新Veo 3.1：AI视频生成迈入“导演级”精控

新智元报道

编辑：定慧

【新智元导读】谷歌凌晨更新Veo 3.1，主打更强叙事与音频控制、首尾帧与多图参考等精控，接入Gemini API与Vertex AI，Flow与Gemini可用。可合成多人物场景、音画同步，片段最长约148秒；规格至1080p/24fps。

刚刚，谷歌在今天凌晨更新了旗舰视频生成模型Veo 3.1。

此次更新主要有两大功能亮点：

更强的叙事与音频控制

更丰富的输入与编辑能力

这次升级让AI对想讲述的故事能有更深的理解。

Veo 3.1让AI视频生成迈入「导演级」精控阶段。

真实与叙事感升级，更高画质与音画同步，让视频更具电影质感。

Veo 3.1目前已接入Gemini API与Vertex AI。

普通用户也可以直接在Flow或者Gemini中体验。

Flow使用方式如下，打开网页labs.google/flow/about，新建项目后即可使用。

Gemini可选择创建Video，即可使用Veo 3.1。

我们使用「威尔斯吃面」极简提示词测试了一下效果，确实已经非常流畅和自然。

对于首尾帧生成，我们也进行了测试，提示词为「奥特曼最后像钢铁侠一样飞走」。

效果也非常好。

Veo 3.1可以将不同人物和物体的照片合成一个完整的场景，并配有声音。

还能创建更长的片段，甚至持续一分钟或更久，延续原始镜头中的动作。

每个生成的视频都基于前一个片段的最后一秒，以帮助延续故事，并保持背景和人物的一致性。

只需提供第一帧和最后一帧，Veo就会让整个场景栩栩如生，创建带有宏大转场的无缝视频。

强推使用Flow来使用和体验Veo 3.1！

5个月前，谷歌正式推出Flow，一款由Veo驱动的AI电影制作工具。

目前，谷歌宣称用户已在Flow中生成了超过2.75亿个视频！

此次Veo 3.1的更新，推出了用于剪辑编辑的新功能和增强创意能力。

Flow还有一个Flow TV的功能，像一个电视台一样，可以不断地换台，观看其他用户生成的创意视频。

Flow TV工作台可以通过工作台进行切换。Flow将2.5亿个视频，分成了不同的频道。

比如碰撞测试、打招呼、感到可爱。。。等等。

而Short Films则是用户制作的微电影，制作更加精良，时间更长。

目前只放出了3部。

比如下面这部名为「FreeLancers」，讲述了这样一个故事：
在纽约一家秘密餐厅的晚餐中，两位久疏音信的养兄弟——一位做事谨慎、另一位喧闹且卤莽——回忆起他们作为国际杀手的职业生涯，直到他们意识到两人竟被雇佣去执行同一项任务：对方。「FreeLancers」电影级别视频如下，电影质感非常高。Veo 3.1技术规格上支持输出720p或1080p分辨率的视频，帧率为24帧/秒（fps）。

视频时长可选4秒、6秒或8秒，若使用Extend功能，视频最长可扩展至148秒。

各位觉得Veo 3.1的效果能不能打过Sora 2呢？

这次的Veo 3.1更像「功能小升级」——新增首尾帧、多图参考等控制。

但成片质感较Veo 3进步有限，甚至略微显得有点「假」。

原生时长仍只有8秒，Flow延长至30秒画面偶有衔接，音频提升其实很一般。

基础物理表现比过去好些，但一遇到人物表演与复杂调度还是会露馅。

但这个只是Veo 3->Veo 3.1的一次微调。

期待一下谷歌年底的大招，估计会配合Gemini 3全家桶发布。

参考资料：

https://x.com/GoogleDeepMind/status/1978491999029219364

文章原文

新智元报道

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签