在2025云栖大会上,阿里发布了通义万相2.5 preview系列模型,重点更新了视频生成能力。新模型首次实现了音画同步的视频生成,能够匹配画面的人声、音效和BGM,并将视频时长提升至10秒,支持1080P高清输出。此外,模型在指令遵循和运镜控制方面也有显著提升,进一步降低了电影级视频创作的门槛。通义App已第一时间接入该模型,用户可免费体验并导出无水印视频。同时,2.5版本还升级了图像生成能力,支持中英文文字和图表生成,并提供了一句话P图的图像编辑功能。
🎬 **音画同步视频生成:** 通义万相2.5系列模型在视频生成方面取得了突破性进展,首次实现了音画同步。这意味着生成的视频不仅画面内容丰富,还能匹配相应的人声、音效和背景音乐(BGM),极大地提升了视频的沉浸感和专业度,为用户创作更具表现力的多媒体内容提供了强大支持。
🚀 **高清长视频与精细控制:** 新模型将视频时长从5秒提升至10秒,并支持24帧每秒的1080P高清输出,显著提升了视频的清晰度和流畅度。同时,模型在指令遵循能力上得到进一步增强,能够更好地理解和执行用户指令,包括复杂的运镜等连续变化控制,使得用户能够更精确地实现其创意构想,降低了制作高质量视频的技术门槛。
🎨 **全面的图像编辑与生成:** 除了视频生成能力的飞跃,通义万相2.5版本在图像处理方面也进行了全面升级。它不仅能够生成包含中英文文字和图表的内容,还提供了便捷的图像编辑功能,用户只需输入一句话,即可快速完成P图等图像修改操作,极大地提高了图像创作和编辑的效率。
🆓 **免费体验与便捷访问:** 用户可以通过通义App第一时间体验通义万相2.5的视频生成模型。目前,用户每天可以免费生成最多15次,并且支持导出无水印的视频,这为广大用户提供了便捷的AI创作入口,鼓励更多人尝试和使用先进的AI视频生成技术。
快科技9月24日消息,在今日2025云栖大会上,阿里发布通义万相Wan2.5 preview系列模型,涵盖文生视频、图生视频、文生图和图像编辑四大模型,而通义App第一时间接入通义万相2.5视频生成模型。
据介绍,该视频生成模型能生成和画面匹配的人声、音效和音乐BGM,首次实现音画同步的视频生成能力。
而视频的时长也从5S提升至10S,并且支持24帧每秒的1080P高清输出,进一步降低电影级视频创作的门槛。
同时,模型指令遵循能力进一步提升,可在视频生成中完成运镜等复杂连续变化的控制。
用户在通义App主对话界面输入生视频指令后,通义App会自动调用该模型为用户生成长达10秒的高清视频。
目前,用户可每天免费生成最多15次,并支持导出无水印视频。

据了解,自今年2月以来,通义万相已连续开源文生视频、图生视频、首尾帧生视频和全能编辑等多款模型,相关功能均可在通义APP直接体验。
此次,通义万相2.5还全面升级了图像生成能力,可生成中英文文字和图表,支持图像编辑功能,输入一句话即可完成P图。
