通义万相2.5发布，视频生成能力大幅提升

快科技资讯 09月24日

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

在2025云栖大会上，阿里发布了通义万相2.5 preview系列模型，重点更新了视频生成能力。新模型首次实现了音画同步的视频生成，能够匹配画面的人声、音效和BGM，并将视频时长提升至10秒，支持1080P高清输出。此外，模型在指令遵循和运镜控制方面也有显著提升，进一步降低了电影级视频创作的门槛。通义App已第一时间接入该模型，用户可免费体验并导出无水印视频。同时，2.5版本还升级了图像生成能力，支持中英文文字和图表生成，并提供了一句话P图的图像编辑功能。

🎬 **音画同步视频生成：** 通义万相2.5系列模型在视频生成方面取得了突破性进展，首次实现了音画同步。这意味着生成的视频不仅画面内容丰富，还能匹配相应的人声、音效和背景音乐（BGM），极大地提升了视频的沉浸感和专业度，为用户创作更具表现力的多媒体内容提供了强大支持。

🚀 **高清长视频与精细控制：** 新模型将视频时长从5秒提升至10秒，并支持24帧每秒的1080P高清输出，显著提升了视频的清晰度和流畅度。同时，模型在指令遵循能力上得到进一步增强，能够更好地理解和执行用户指令，包括复杂的运镜等连续变化控制，使得用户能够更精确地实现其创意构想，降低了制作高质量视频的技术门槛。

🎨 **全面的图像编辑与生成：** 除了视频生成能力的飞跃，通义万相2.5版本在图像处理方面也进行了全面升级。它不仅能够生成包含中英文文字和图表的内容，还提供了便捷的图像编辑功能，用户只需输入一句话，即可快速完成P图等图像修改操作，极大地提高了图像创作和编辑的效率。

🆓 **免费体验与便捷访问：** 用户可以通过通义App第一时间体验通义万相2.5的视频生成模型。目前，用户每天可以免费生成最多15次，并且支持导出无水印的视频，这为广大用户提供了便捷的AI创作入口，鼓励更多人尝试和使用先进的AI视频生成技术。

快科技9月24日消息，在今日2025云栖大会上，阿里发布通义万相Wan2.5 preview系列模型，涵盖文生视频、图生视频、文生图和图像编辑四大模型，而通义App第一时间接入通义万相2.5视频生成模型。

据介绍，该视频生成模型能生成和画面匹配的人声、音效和音乐BGM，首次实现音画同步的视频生成能力。

而视频的时长也从5S提升至10S，并且支持24帧每秒的1080P高清输出，进一步降低电影级视频创作的门槛。

同时，模型指令遵循能力进一步提升，可在视频生成中完成运镜等复杂连续变化的控制。

用户在通义App主对话界面输入生视频指令后，通义App会自动调用该模型为用户生成长达10秒的高清视频。

目前，用户可每天免费生成最多15次，并支持导出无水印视频。

据了解，自今年2月以来，通义万相已连续开源文生视频、图生视频、首尾帧生视频和全能编辑等多款模型，相关功能均可在通义APP直接体验。

此次，通义万相2.5还全面升级了图像生成能力，可生成中英文文字和图表，支持图像编辑功能，输入一句话即可完成P图。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签