IT之家 07月07日
B站开源动漫视频生成模型 AniSora V3 版,速度更快、质量更高
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

B站团队推出的开源动漫视频生成模型AniSora于7月2日发布V3预览版,该版本在生成质量、动作流畅度和风格多样性上进行了全面优化。AniSora V3基于CogVideoX-5B和Wan2.1-14B模型,并结合RLHF框架,显著提升了视频的视觉质量和动作一致性。新版本支持多种动漫风格视频生成,包括番剧、国创动画、漫画改编等,并新增了对华为Ascend910B NPU的原生支持,推理速度提升约20%。

🎬 **核心升级与优化:** AniSora V3版本增强了时空控制能力,支持更复杂的动画任务,比如精细的角色表情控制和动态镜头移动,同时新增了数据清洗流水线,确保生成内容的风格一致性和细节丰富度。

🚀 **硬件与速度提升:** V3版本新增对华为Ascend910B NPU的原生支持,完全基于国产芯片训练,推理速度提升约20%,生成4秒高清视频仅需2-3分钟。

💡 **多任务学习与应用:** V3强化了多任务处理能力,支持单帧图像生成视频、关键帧插值到唇部同步等功能,特别适合漫画改编和VTuber内容创作。同时,V3支持多种动漫风格,覆盖90%的动漫视频应用场景,包括单图转视频、漫画改编、VTuber与游戏等。

🏆 **性能表现:** 在VBench和双盲主观测试中,AniSora V3在角色一致性和动作流畅度上均达到业界顶尖水平(SOTA),尤其在复杂动作上表现突出。同时,相比V2,V3在生成复杂场景时,减少了约15%的伪影问题,生成时间缩短至平均2.5分钟。

IT之家 7 月 7 日消息,B站团队的开源动漫视频生成模型 AniSora 于 7 月 2 日更新到 AniSora V3 预览版

作为 Index-AniSora 项目的一部分,V3 版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性,为动漫、漫画及 VTuber 内容创作者提供了更强大的工具。

AniSora 支持一键生成多种动漫风格的视频镜头,包括番剧片段、国创动画、漫画改编、VTuber 内容、动画 PV、鬼畜(MAD)等。

AniSora V3 基于B站此前开源的 CogVideoX-5B 和 Wan2.1-14B 模型,结合强化学习与人类反馈(RLHF)框架,显著提升了生成视频的视觉质量和动作一致性。其支持一键生成多种风格的动漫视频镜头,包括番剧片段、国创动画、漫画视频改编、VTuber 内容等。

核心升级包括:

在最新基准测试中,AniSora V3 在 VBench 和双盲主观测试中,角色一致性和动作流畅度均达到业界顶尖水平(SOTA),尤其在复杂动作 (如违反物理规律的夸张动漫动作) 上表现突出。

V3 还引入了首个针对动漫视频生成的 RLHF 框架,通过 AnimeReward 和 GAPO 等工具对模型进行微调,确保输出更符合人类审美和动漫风格需求。社区开发者已开始基于 V3 开发定制化插件,例如增强特定动漫风格(如吉卜力风)的生成效果。

AniSora V3 支持多种动漫风格,包括日本动漫、国产原创动画、漫画改编、VTuber 内容及恶搞动画(鬼畜动画),覆盖 90% 的动漫视频应用场景。具体应用包括:

AIbase 测试显示,V3 在生成复杂场景(如多角色交互、动态背景)时,相比 V2 减少了约 15% 的伪影问题,生成时间缩短至平均 2.5 分钟(IT之家注:4 秒视频)

相比 OpenAI 的 Sora 或 Kling 等通用视频生成模型,AniSora V3 专注于动漫领域。与字节跳动的 EX-4D 相比,AniSora V3 更专注于 2D / 2.5D 动漫风格,而非 4D 多视角生成。

IT之家附开源地址:

https://github.com/bilibili/Index-anisora/tree/main

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AniSora V3 动漫视频生成 B站 人工智能
相关文章