IT之家 10月10日 14:43
三星发布微型递归模型,性能媲美巨头大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,该模型仅包含 700 万个参数。令人瞩目的是,TRM 在数独、迷宫等结构化推理任务上的表现,能够媲美甚至超越参数量达其万倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。TRM 的设计理念是极致简化复杂性,采用递归推理机制,通过迭代修正预测来模拟复杂推理过程,实现了“以递归替代规模”的目标,大幅降低了计算和内存成本。虽然 TRM 并非通用语言模型,但其在特定领域的出色表现,为 AI 领域“小模型”对抗“大模型”的趋势提供了新的有力例证。其代码已在 GitHub 上完全开源。

💡 **微型递归模型(TRM)的颠覆性表现**:三星高级 AI 研究院发布的 TRM 模型,以其仅 700 万的参数量,在数独、迷宫等结构化推理任务上,展现了超越谷歌 Gemini 2.5 Pro 等巨型模型的惊人能力。这标志着 AI 领域“小模型”在特定任务上具备与“大模型”抗衡甚至超越的潜力,为资源受限或特定场景下的 AI 应用提供了新的可能性。

🔄 **“以递归替代规模”的核心机制**:TRM 的核心技术在于其“递归推理”机制。模型并非依赖庞大的参数量,而是通过对自身预测进行反复迭代和修正,每一步都纠正前一步的潜在错误,直至答案稳定收敛。这种设计巧妙地用计算深度模拟了复杂网络的推理过程,有效降低了模型所需的计算和内存资源,实现了在不牺牲性能的前提下大幅优化模型效率。

🧩 **精准定位的结构化推理能力**:需要强调的是,TRM 是专为解决结构化、可视化的网格类问题而设计的,例如数独、迷宫和特定的解谜任务。它在有明确规则的封闭环境中进行逻辑推理方面表现出色,而非通用语言模型那样具备开放式的语言生成能力。尽管如此,其在 ARC-AGI 等抽象推理测试中也取得了显著成绩,证明了其在特定领域的强大适应性和效能。

🚀 **开源共享与未来发展**:TRM 的全部代码、训练脚本和数据集已根据 MIT 许可证在 GitHub 上完全开源。这意味着企业和研究人员可以免费使用、修改和部署该模型,甚至将其用于商业应用。这一举措极大地促进了 AI 技术的普及和创新,为该模型在更多领域的应用和进一步发展奠定了坚实基础。

IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

该 AI 模型由三星高级 AI 研究院(SAIT)高级 AI 研究员 Alexia Jolicoeur-Martineau 发布,成为 AI 领域“小模型”对抗“大模型”的趋势的重磅新案例。

该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

尽管模型极小,TRM 在多个基准测试中展现了“以小博大”的惊人实力:

尽管 TRM 使用的参数不到 0.01%,但这些结果仍然超过或接近几种高端大型语言模型的性能,包括 DeepSeek R1 、 Gemini 2.5 Pro 和 o3-mini 。

然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。

IT之家附上参考地址

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

三星 微型递归模型 TRM AI 人工智能 大模型 小模型 结构化推理 开源
相关文章