AI & Big Data 10月10日 13:09
Tiny Recursion Model:小模型展現高效遞迴推理能力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

三星先進技術研究院研究員Alexia Jolicoeur-Martineau提出了Tiny Recursion Model(TRM),一個僅約700萬參數的小型模型。TRM在ARC-AGI-1基準測試中達到44.6%的正確率,ARC-AGI-2則為7.8%,表現超越許多大型語言模型,儘管仍低於Grok-4系列。TRM的核心在於遞迴推理,透過單一小型神經網路在固定步數內重複檢查與修正答案,模擬人類解難時的反覆推敲過程。相較於先前需要多個網路的HRM,TRM結構更簡潔、運算成本更低。TRM在數獨和迷宮等任務上也表現出色,並指出過度依賴大型模型可能限制研究發展,鼓勵探索新的研究方向。

💡Tiny Recursion Model(TRM)以極小的參數量(約700萬)展現出卓越的問題解決能力,在ARC-AGI-1基準測試中達到44.6%的準確率,證明了小型模型在特定機制下也能與大型模型競爭,打破了過去對模型規模與效能的刻板印象。

🧠TRM的核心創新在於其遞迴推理機制,透過單一神經網路在多個迭代步驟中反覆檢視、修正自身產生的潛在表示,逐步優化答案,這種方法模仿了人類在思考過程中不斷自我校準的過程,有效提升了解題效率與準確性。

⚙️相較於先前研究中的HRM(Hierarchical Reasoning Model)需要兩個獨立的神經網路協同運作,TRM僅需一個網路即可完成遞迴推理流程,顯著簡化了模型架構,降低了運算成本,使其在資源受限的環境下也具備應用潛力。

🚀TRM在數獨極難版(Sudoku-Extreme)和迷宮(Maze-Hard)等解謎任務上也取得了優異的成績,分別達到87.4%和85.3%的準確率,進一步驗證了其遞迴推理機制在處理邏輯和抽象推理問題上的有效性。

📈研究者Alexia Jolicoeur-Martineau強調,過度依賴昂貴的大型基礎模型可能限制AI研究的進步,主張業界應更多關注和拓展新的研究方向,例如TRM所展示的遞迴推理機制,以推動AI技術的可持續發展。

三星(Samsung)先進技術研究院蒙特婁研究員Alexia Jolicoeur-Martineau發表Tiny Recursion Model(TRM)研究,以僅約700萬參數的小模型,在ARC-AGI-1基準測試達44.6%正確率,在ARC-AGI-2則達7.8%。雖然其表現仍低於Grok-4系列模型,但已超越多個大型語言模型。相關論文已公開發表,並於GitHub平臺開放原始碼

TRM高效的關鍵在於遞迴推理(Recursive Reasoning),這是一種讓模型在思考過程中重複檢查與修正自己答案的方法。TRM只使用一個小型神經網路,在固定的步數內不斷進行再思考與修正,運作方式是先將題目與初步答案輸入模型,模型會生成一組潛在表示,代表其對問題的理解。接著,模型在每一步都重新檢視這些潛在變數,根據新的理解修正先前的答案,並逐步逼近更合理的解答。

TRM的設計有點像人類解難時反覆推敲的過程,每次思考都會帶來新的線索或更好的推理方向。相較於之前的重要研究HRM(Hierarchical Reasoning Model)需要兩個小網路分別在不同頻率下遞迴運作,TRM僅靠單一網路即可完成整個反覆推理流程,結構更簡潔、運算成本也更低。這讓TRM能以極少的參數量達到不錯的問題解決能力,也展現了小模型透過遞迴思考機制,仍可表現出一定的邏輯與抽象推理能力。

TRM在多個解謎任務基準測試的表現亮眼,數獨極難版Sudoku-Extreme最高87.4%,以及迷宮Maze-Hard 85.3%。其中,ARC-AGI-1的44.6%與ARC-AGI-2的7.8%被拿來與其他大語言模型,例如DeepSeek R1、o3-mini與Gemini 2.5 Pro做比較,其以不到其千分之一的參數量呈現相對優勢。

作者Alexia Jolicoeur-Martineau同時指出,過度依賴大型企業以數百萬美元訓練的大型基礎模型來解決複雜問題,將會造成限制。他認為,目前產業界過於關注大型語言模型現有的能力,而非致力於設計並拓展新的研究方向。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Tiny Recursion Model TRM 遞迴推理 Recursive Reasoning 小型模型 Small Models AI研究 AI Research 三星 Samsung
相关文章