Google推出Veo 3.1,並在人工智慧影片製作工具Flow添加一系列更新,重點在於把音訊帶進既有流程,並提升敘事與寫實表現。官方指出,這次更新讓使用者在Flow中應用更細緻的方式編修片段,從前期設計到完成影片都有更高掌控度。
Flow底層使用生成式影片模型Veo,Google表示,從推出Flow以來,用戶回饋最需要的是更高的藝術掌控與音訊支援,此次更新便是將這兩點納入開發優先。
Flow三項既有功能現在結合音訊,其一是Ingredients to Video,允許上傳多張參考影像,藉此控制角色、物件與風格,現在能同時生成對應的音訊,其二是Frames to Video,使用者可提供起始與結束影像,系統自動插補中間段落與音訊,適合用於平順轉場,而第三則是Extend,可依據前一支影片最後1秒續接,可將鏡頭延長至約1分鐘或更長,並同時生成對應音訊。
針對後期影片編輯,Flow加入了物件插入功能,可在任何場景置入新元素,系統會處理陰影與場景光源,使合成更自然。另外,物件移除功能即將上線,用戶移除物件後Flow會重建背景與周邊,降低視覺破綻。
模型本身方面,Veo 3.1在提示遵循度、敘事控制與真實感上有所強化,特別是在把影像轉成影片時的視聽品質。官方用語是能捕捉更貼近真實材質的細節,目標是讓生成內容在動態與聲音上更接近實拍效果。
Veo 3.1除可直接在Flow中體驗,也已透過Gemini API提供給開發者,並在Vertex AI面向企業用戶,以及在Gemini App提供一般使用情境。Google同時指出,新功能已在Gemini API與Vertex AI開放對應支援,開發者文件也已標示Veo 3.1支援的參考影像數量與首尾影格生成等功能。
