新智元 10月16日 16:16
谷歌更新Veo 3.1:AI视频生成迈入“导演级”精控
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌发布了旗舰视频生成模型Veo 3.1,引入两大核心亮点:增强的叙事能力与音频控制,以及更丰富的输入与编辑功能,使AI视频生成迈向“导演级”精控。新版本能够合成多人物场景,实现音画同步,并生成长达约148秒的视频片段,支持1080p/24fps规格。Veo 3.1已接入Gemini API与Vertex AI,用户可通过Flow或Gemini体验。其新增的首尾帧控制、多图参考等功能,让AI对故事的理解更深入,视频更具电影质感。Flow平台用户已生成超2.75亿个视频,此次更新进一步增强了剪辑编辑和创意能力。

🎬 **AI视频生成的“导演级”精控:** Veo 3.1通过增强叙事理解和音频控制,以及首尾帧、多图参考等精细化输入与编辑能力,使AI视频生成达到了新的高度,能够更精准地实现创作者的意图,提升视频的真实感和电影质感。

✨ **丰富的创意输入与长时生成:** 新模型支持合成多人物、多元素的复杂场景,并能实现音画高度同步。视频片段最长可达约148秒,远超以往,为故事讲述提供了更广阔的空间。同时,支持1080p/24fps的规格,保证了视频的清晰度和流畅性。

🚀 **便捷的体验与广泛的应用:** Veo 3.1已无缝接入Gemini API和Vertex AI,用户可通过Flow或Gemini直接体验。Flow平台在过去五个月内已驱动用户生成超过2.75亿个视频,显示了其强大的用户基础和广泛的吸引力,此次更新将进一步丰富Flow的创意工具箱。


  新智元报道  

编辑:定慧
【新智元导读】谷歌凌晨更新Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入Gemini API与Vertex AI,Flow与Gemini可用。可合成多人物场景、音画同步,片段最长约148秒;规格至1080p/24fps。


刚刚,谷歌在今天凌晨更新了旗舰视频生成模型Veo 3.1。

此次更新主要有两大功能亮点:

更强的叙事与音频控制

更丰富的输入与编辑能力

这次升级让AI对想讲述的故事能有更深的理解。

Veo 3.1让AI视频生成迈入「导演级」精控阶段。

真实与叙事感升级,更高画质与音画同步,让视频更具电影质感。

Veo 3.1目前已接入Gemini API与Vertex AI。

普通用户也可以直接在Flow或者Gemini中体验。

Flow使用方式如下,打开网页labs.google/flow/about,新建项目后即可使用。

Gemini可选择创建Video,即可使用Veo 3.1。

我们使用「威尔斯吃面」极简提示词测试了一下效果,确实已经非常流畅和自然。

对于首尾帧生成,我们也进行了测试,提示词为「奥特曼最后像钢铁侠一样飞走」。
效果也非常好。

Veo 3.1可以将不同人物和物体的照片合成一个完整的场景,并配有声音。

还能创建更长的片段,甚至持续一分钟或更久,延续原始镜头中的动作。

每个生成的视频都基于前一个片段的最后一秒,以帮助延续故事,并保持背景和人物的一致性。

只需提供第一帧和最后一帧,Veo就会让整个场景栩栩如生,创建带有宏大转场的无缝视频。

强推使用Flow来使用和体验Veo 3.1!

5个月前,谷歌正式推出Flow,一款由Veo驱动的AI电影制作工具。

目前,谷歌宣称用户已在Flow中生成了超过2.75亿个视频!

此次Veo 3.1的更新,推出了用于剪辑编辑的新功能和增强创意能力。

Flow还有一个Flow TV的功能,像一个电视台一样,可以不断地换台,观看其他用户生成的创意视频。

Flow TV工作台可以通过工作台进行切换。Flow将2.5亿个视频,分成了不同的频道。

比如碰撞测试、打招呼、感到可爱。。。等等。

而Short Films则是用户制作的微电影,制作更加精良,时间更长。

目前只放出了3部。

比如下面这部名为「FreeLancers」,讲述了这样一个故事:
在纽约一家秘密餐厅的晚餐中,两位久疏音信的养兄弟——一位做事谨慎、另一位喧闹且卤莽——回忆起他们作为国际杀手的职业生涯,直到他们意识到两人竟被雇佣去执行同一项任务:对方。「FreeLancers」电影级别视频如下,电影质感非常高。Veo 3.1技术规格上支持输出720p或1080p分辨率的视频,帧率为24帧/秒(fps)。

视频时长可选4秒、6秒或8秒,若使用Extend功能,视频最长可扩展至148秒。

各位觉得Veo 3.1的效果能不能打过Sora 2呢?

这次的Veo 3.1更像「功能小升级」——新增首尾帧、多图参考等控制。

但成片质感较Veo 3进步有限,甚至略微显得有点「假」。

原生时长仍只有8秒,Flow延长至30秒画面偶有衔接,音频提升其实很一般。

基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。

但这个只是Veo 3->Veo 3.1的一次微调。

期待一下谷歌年底的大招,估计会配合Gemini 3全家桶发布。

参考资料:
https://x.com/GoogleDeepMind/status/1978491999029219364




文章原文

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Veo 3.1 谷歌 AI视频生成 Gemini Flow 深度学习 人工智能 内容创作 视频技术
相关文章