IT之家 9 月 25 日消息,“全球首个中文音视频一体化视频生成模型”百度蒸汽机今天宣布再次升级,并发布 通用 AI 长视频生成 功能。 该功能支持用户生成无限长度的 AI 视频。根据官方介绍,本次升级在行业尚属首次,突破了此前 AI 仅能生成 5 秒、10 秒短视频,或依赖首尾帧控制续写时长的局限,借助 流式生成技术 实现了在通用长视频上的 “无限”生成能力 。 就在上个月,百度蒸汽机音视频一体化模型完成 2.0 版本升级,在行业内首次实现 多人有声视频一体化 生成。IT之家从官方获悉,2.0 版本基于 多模态时空规划、中文场景深度优化以及音视端到端建模 等领先的技术能力,实现多人音视频一体化生成、复杂运镜、电影级的人物细腻表演、丰富镜头表现和流畅画质等。 相关阅读: 《 百度蒸汽机 2.0 大模型上线,行业首次实现多人有声视频一体化生成 》
