集智俱乐部 10月30日 18:35

“赫胥黎–哥德尔机”：AI智能体实现自我改进新突破

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Jürgen Schmidhuber 提出的“赫胥黎–哥德尔机”（HGM）在人工智能自我进化领域取得新进展。该模型引入“谱系元生产力”（CMP）指标，使智能体能基于自身谱系的长期潜力进行优化。在多项编程智能体基准测试中，HGM 表现出色，媲美人类设计系统，为可自我改进的通用人工智能奠定理论与实践基础。研究发现，智能体的自我改进潜力和当前性能可能存在脱节，HGM 通过估计 CMP 来指导自我修改，有效解决了这一“元生产力-性能不匹配”问题，并在 SWE-bench 等测试中展现出超越现有方法的性能和迁移能力。

💡 **AI的自我进化新模型：** 赫胥黎–哥德尔机（HGM）是Jürgen Schmidhuber提出的新一代人工智能模型，旨在实现智能体的自我学习和改进。它在前人“哥德尔机”理论基础上，引入“谱系元生产力”（CMP）这一核心指标，让智能体能够基于其整个谱系的长期发展潜力来进行自我优化，而非仅仅关注当前的短期性能。

🚀 **解决“元生产力-性能不匹配”难题：** 研究发现，智能体的当前基准测试性能与其真正的自我改进潜力之间可能存在脱节。HGM 通过估计 CMP 来解决这一“元生产力-性能不匹配”问题。CMP衡量的是一个智能体基于其谱系的长期潜力，它能更准确地指导智能体进行自我修改，以实现更可持续和有效的自我改进。

🏆 **卓越的性能与泛化能力：** 在SWE-bench Verified和Polyglot等编程智能体基准测试中，HGM展现出超越现有自我改进方法（如DGM和SICA）的性能，并且实际运行时间更少。更重要的是，HGM表现出强大的跨数据集和跨大语言模型的迁移能力，证明了其自我进化出的智能体设计原则是普适的，而非过度拟合特定模型或数据集。

🤝 **媲美人类设计：** HGM在SWE-bench Lite基准测试中，其优化的智能体达到了人类水平的表现，与官方验证的最佳人工设计编程智能体相当。这表明HGM不仅是技术上的突破，也预示着AI在自主设计和解决复杂问题方面正迈向新的高度。

机器之心 2025-10-29 21:09 上海

AI能学会自己进化？“赫胥黎–哥德尔机”让智能体实现自我改进新突破

导语

继提出 LSTM 与哥德尔机理论后，Jürgen Schmidhuber 再次推进人工智能的“自我进化”之梦。他提出的赫胥黎–哥德尔机（Huxley–Gödel Machine, HGM），通过引入“谱系元生产力”（Clade Metaproductivity, CMP）指标，让智能体能基于自身谱系的长期潜力自我优化。在多项编程智能体基准中，HGM 实现了超越以往模型、媲美人类设计系统的表现，为可自我改进的通用人工智能奠定了新理论与实践基础。

关键词：赫胥黎–哥德尔机（HGM）；哥德尔机；自我改进智能体；元生产力（Metaproductivity）；谱系元生产力（CMP）；通用人工智能（AGI）；自进化学习

冷猫、陈陈丨作者

机器之心丨来源

实现通用人工智能的一大终极目标就是创建能够自我学习，自我改进的人工智能体。

这个目标已经是老生常谈了。其实在 2003 年，能够自我改进的智能体的理论模型就已经由著名的「现代 AI 之父」Jürgen Schmidhuber 提出，称为哥德尔机。

哥德尔机是一种自我改进型通用智能系统理论模型，设计灵感来自于哥德尔（Kurt Gödel）的不完备性定理。它的核心思想是：机器能够像数学家一样，通过形式证明自身程序的改进在长期内将带来更高收益，然后安全地修改自己。

通俗来说，就是一个「能改写自己」的自我进化的智能体。

而在最近，Jürgen Schmidhuber 对当年提出的理论哥德尔模型进行了一次全新的尝试，构建了赫胥黎 - 哥德尔机，能够在 SWE-Bench Lite 上与官方验证的最佳人类设计的智能体相媲美。

Jürgen Schmidhuber 是一名德国计算机科学家，以人工智能、深度学习和人工神经网络领域的成就而知名，现任达勒・莫尔人工智能研究所（IDSIA）联合主任，阿卜杜拉国王科技大学人工智能研究院院长。

1997 年，Jürgen Schmidhuber 发表了长短期记忆网络（LSTM）论文。2011 年，Jürgen Schmidhuber 在 IDSIA 的团队 GPU 上实现了卷积神经网络（CNN）的显著加速，这种方法基于杨立昆等人早期提出的 CNN 设计，已成为计算机视觉领域的核心。

论文标题：Huxley-Gödel Machine: Human-Level Coding Agent Development by an Approximation of the Optimal Self-Improving Machine
论文链接：https://arxiv.org/abs/2510.21614Github
链接：https://github.com/metauto-ai/HGM

该研究基于如下发现：编码智能体通过编辑自身代码来实现自我改进，通常采用一种树形结构来记录修改过程，其扩展策略倾向于选择在软件工程基准测试中得分更高的智能体，并假设高分意味着其后继的自我修改也更有可能成功。

然而，研究者发现，一个智能体真正的自我改进潜力与其当前的基准测试性能之间存在着脱节。他们将这个现象命名为「元生产力 - 性能不匹配」。

受赫胥黎谱系（clade）概念启发，Jürgen 等人提出了 CMP（clade-level metaproductivity，谱系元生产力）。该指标通过聚合一个智能体所有后代的性能来衡量其潜力，而非只看其自身分数。

本文证明了在自我改进编程智能体的开发环境中，只要能够获取真实的 CMP，就足以模拟哥德尔机在特定假设下的行为方式。

进一步的，本文提出的赫胥黎 - 哥德尔机（HGM）通过估计 CMP 并以其为指导，可以在自我修改的树结构中进行搜索。

在 SWE-bench Verified 和 Polyglot 基准测试中，HGM 不仅超越了先前的自我改进编程智能体方法，同时消耗的实际运行时间更少。

更重要的是，HGM 展现出向其他编码数据集和大语言模型的强大迁移能力。使用 GPT-5-mini 在 SWE-bench Verified 上通过 HGM 优化的智能体，在 SWE-bench Lite 上使用 GPT-5 进行评估时，达到了人类水平的表现，与经过官方验证的最佳人工设计编程智能体的结果相当。

赫胥黎 - 哥德尔机器

自由能原理与强化学习读书会
自由能原理被认为是“自达尔文自然选择理论后最包罗万象的思想”，它试图从物理、生物和心智的角度提供智能体感知和行动的统一性规律，从第一性原理出发解释智能体更新认知、探索和改变世界的机制，从而对人工智能，特别是强化学习世界模型、通用人工智能研究具有重要启发意义。
集智俱乐部联合北京师范大学系统科学学院博士生牟牧云，南京航空航天大学副教授何真，以及骥智智能科技算法工程师、公众号 CreateAMind 主编张德祥，共同发起「自由能原理与强化学习读书会」，希望探讨自由能原理、强化学习世界模型，以及脑与意识问题中的预测加工理论等前沿交叉问题，探索这些不同领域背后蕴含的感知和行动的统一原理。读书会已完结，现在报名可加入社群并解锁回放视频权限。
详情请见：
自由能原理与强化学习读书会启动：探索感知和行动的统一原理

赫胥黎 - 哥德尔机器

实验结果

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签