三花AI 10月11日 11:38
AI 领域新进展:编程模型、扩散模型、视频生成及多模态应用教程
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期 AI 领域涌现多项重要进展。快手开源了编程专用大模型 KAT-Dev-72B-Exp,在 SWE-Bench 测试中准确率达 74.6%,且免费使用。Radical Numerics 推出了 RND1,号称是目前最强的开源扩散语言模型,并以“简单持续预训练”方法构建,目标是实现 AI 的递归自我改进。GAGA-1 视频生成模型现已开放免费试用,能生成好莱坞级别画质的虚拟形象视频,效果优于现有开源模型。此外,阿里发布了 Qwen3-VL Cookbooks,提供一系列 AI 应用场景的官方教程和代码示例,涵盖计算机操作助手、多模态编程、文档解析等多种场景,为开发者提供了丰富的实践指导。

🚀 **快手开源 KAT-Dev-72B-Exp 编程模型:**该模型是专为编程任务设计的大语言模型,在 SWE-Bench Verified 基准测试中取得了 74.6% 的高准确率,并且用户可以通过 Streamlake API 平台免费使用,为开发者提供了强大的编程辅助工具。

💡 **RND1:最强开源扩散语言模型与递归自我改进愿景:**Radical Numerics 推出的 RND1 模型,基于 Qwen3-30B-A3B 模型通过“简单持续预训练”方法转换而来,官方宣称其为规模最大、能力最强的实验性开源扩散语言模型,其长远目标是构建一个递归自我改进(RSI)引擎,让 AI 能够自主设计下一代 AI。

🎬 **GAGA-1 视频生成模型:虚拟数字人创作新选择:**GAGA-1 专注于虚拟形象视频的生成,并已提供免费试用。该模型据称能达到好莱坞级别的画质,其生成效果在清晰度和流畅性方面优于当前开源生态中的其他模型,为数字人视频创作提供了新的高质量解决方案。

📚 **阿里 Qwen3-VL Cookbooks:丰富 AI 应用场景教程:**阿里发布的 Qwen3-VL Cookbooks 是一份全面的官方教程合集,详细介绍了多种 AI 应用场景,包括但不限于计算机操作助手、多模态编程、全场景识别、文档解析、精准目标定位、通用 OCR、关键信息提取、3D 定位、长文档理解、空间推理、移动端智能助手和视频理解等,每个场景都附带了详细的代码示例,极大地便利了开发者进行相关 AI 应用的实践和开发。

原创 小茸茸 2025-10-11 10:58 重庆

快手开源KAT-Dev-72B-Exp编程模型:SWE-Bench 74.6%准确率;RND1:目前最强开源扩散语言模型;GAGA-1视频生成模型:数字人视频创作新选择;阿里 Qwen3-VL Cookbooks:AI 应用场景官方教程合集

快手开源 KAT-Dev-72B-Exp 编程模型:SWE-Bench 74.6% 准确率

KAT-Dev-72B-Exp[1] 是快手最新发布的编程专用大语言模型。该模型在 SWE-Bench Verified 基准测试中表现优异,达到了 74.6% 的准确率。

佬们可以按照其 API 平台 Streamlake 的官方文档[2] 将其用于 Claude Code,目前完全免费使用,不嫖白不嫖!

RND1:目前最强开源扩散语言模型

RND1(Radical Numerics Diffusion)[3]是官方宣称规模最大、能力最强的实验性开源扩散语言模型。它通过一种名为'简单持续预训练'(Simple Continual Pretraining)的方法,基于预训练自回归模型 Qwen3-30B-A3B 转换而来。

最有趣的是,他们的目标居然是构建一个用于递归自我改进(RSI)的引擎——让 AI 能够设计下一代 AI,这波操作可以说是相当有野心了!

GAGA-1 视频生成模型:数字人视频创作新选择

GAGA-1 模型[4]专为虚拟形象视频生成设计,现已开放免费试用。

官方宣称达到好莱坞级别画质,从演示效果来看确实还可以,画面比开源生态的 wan2.2 要清晰流畅一些。

阿里 Qwen3-VL Cookbooks:AI 应用场景官方教程合集

阿里官方推出的 Qwen3-VL Cookbooks[5] 教程合集,涵盖了从基础到进阶的多种 AI 应用场景:包括计算机操作智能助手、多模态编程、全场景识别、文档解析、精准目标定位、通用 OCR、关键信息提取、3D 定位、长文档理解、空间推理、移动端智能助手和视频理解等。

每个场景都配有详细的代码示例,有做类似需求的佬们可以看看。


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞在看收藏分享 五连警告,这对我真的很重要

Reference

[1] KAT-Dev-72B-Exp 模型页面: https://huggingface.co/Kwaipilot/KAT-Dev-72B-Exp

[2] Streamlake 官方文档: https://www.streamlake.ai/document/DOC/mg6k6nlp8j6qxicx4c9

[3] RND1 官方介绍页面: https://www.radicalnumerics.ai/blog/rnd1

[4] GAGA-1 模型官方演示: https://x.com/GagaAI_official/status/1976502656693829831

[5] Qwen3-VL Cookbooks GitHub仓库: https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 编程模型 扩散模型 视频生成 多模态 大模型 开源 KAT-Dev-72B-Exp RND1 GAGA-1 Qwen3-VL 快手 Radical Numerics 阿里
相关文章