科技媒体testingcatalog曝光了谷歌新一代文生视频模型Veo 3.1的真实生成样本。该模型已出现在Vertex AI云平台和Google Vids视频创作工具中,能够生成时长8秒、分辨率720p且包含音轨的视频片段。相较于前代,Veo 3.1对文本提示词的理解更深入,画面保真度和细节表现更佳,修复了物体比例失调等问题,整体输出质量显著提升,例如在“赛博朋克黑客机器人”和“火山喷发”的对比测试中展现出巨大飞跃。
✨ **Veo 3.1模型能力提升**:谷歌新一代文生视频模型Veo 3.1已初步曝光,其生成视频样本具备8秒时长、720p分辨率,并首次加入了音轨功能,使得视频内容更具表现力。相较于前代模型,Veo 3.1在理解文本提示词方面更加精准,能够生成视觉保真度更高、细节更丰富的画面,例如更逼真的熔岩流动感和恐龙形态,显著提升了视频的整体质量。
🤖 **核心功能与集成**:Veo 3.1模型的核心文生视频功能已集成在Google Vids视频创作工具中,用户可以通过输入文本提示词来生成视频。此外,该模型也在Vertex AI云平台上有所体现,表明其在谷歌的AI服务生态系统中扮演着重要角色,为用户提供更强大的视频创作能力。
🚀 **性能改进与问题修复**:与前代模型相比,Veo 3.1在性能上实现了巨大飞跃。它能更细致地处理提示词中的细微差别,有效解决了前代模型中偶尔出现的物体比例失调等问题,使得生成的视频内容更加稳定和准确,为用户带来更可靠、高质量的视频生成体验。
IT之家 10 月 11 日消息,科技媒体 testingcatalog 昨日(10 月 10 日)发布博文,曝光了谷歌新一代文生视频模型 Veo 3.1 的首批真实生成样本,能够生成时长 8 秒、分辨率为 720p 且包含音轨的视频片段。
该媒体指出在云平台 Vertex AI 及视频创作工具 Google Vids 中,已经出现新一代模型 Veo 3.1 的踪迹,首批由 Veo 3.1 生成的真实视频样本已流出。
集成在 Google Vids 中的 Veo 3.1 已具备核心的文生视频功能,用户可输入文本提示词,生成时长为 8 秒、分辨率为 720p 的视频片段。此次更新的一大亮点是视频自带音轨,其配乐相比前代更具感染力。
从曝光的“赛博朋克黑客机器人”和“火山喷发”等对比测试视频来看,Veo 3.1 在性能上实现了巨大飞跃。IT之家附上相关视频如下:
相较于前代模型 Veo 3 有时略显重复的输出,Veo 3.1 对提示词的细微之处理解得更透彻,生成的画面在视觉保真度和细节丰富度上表现更优,例如能够精准呈现熔岩的流动感或更逼真的恐龙形态。此外,3.1 版修复了前代模型中偶尔出现的物体比例失调等问题,整体输出质量更稳定、更准确。