36氪 - AI相关文章 10月28日 11:15
GeoEvolve:AI引领地理模型自主进化
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

GeoEvolve是一个由MIT和斯坦福学者提出的新框架,旨在让AI像科学家一样自主进化地理模型。该框架将地理知识“嵌入”AI,并让大模型成为能够自主改进算法的“科研合作者”,而非仅仅是辅助工具。通过“导师”(地理知识库GeoKnowRAG)和“博士生”(AI代码进化器、分析器)的双循环机制,GeoEvolve在保留地理学原理的基础上,实现了对经典地理模型(如Kriging)的自动化改进,并在实际案例研究中显著提升了预测精度,为AI在地理科学领域的应用开辟了新道路。

🌍 **AI驱动的地理模型自主进化**:GeoEvolve框架旨在让AI不再仅仅是辅助工具,而是能够像科学家一样自主地发现、改进和进化地理空间模型。它通过结合AI的自主演化能力与结构化的地理空间知识,实现了对算法的自动化开发,为地理建模的未来提供了新视角。

🧠 **地理知识引导的AI进化**:GeoEvolve的核心创新在于将地理学原理“嵌入”AI的进化过程中。通过一个名为GeoKnowRAG的地理知识检索模块,系统能够调用来自学术文献和经典算法的领域知识,确保AI在优化代码时遵循空间理论,避免“跑偏”,生成具有地理学合理性的模型。

🤝 **“导师-博士生”双循环机制**:该框架巧妙地模拟了科研团队的协作模式。AI扮演“博士生”,在代码进化器和分析器的作用下,不断试错、生成和改进算法;而“导师”GeoKnowRAG则提供地理知识的指导和约束。这种内外双循环机制确保了算法演化的高效性和可靠性。

📈 **Kriging模型的自动化改进案例**:通过对经典的地质统计学方法Kriging的案例研究,GeoEvolve展示了其强大的实际应用能力。它自动注入了如自适应经验变差图估计、多起点全局拟合和自适应数据变换等改进,显著提升了预测精度,优于传统Kriging及其他自动化算法发现的模型,证明了知识引导型算法进化的关键作用。

以下或许是一位地理科研工作者的日常:为了让所需的地理模型表现得更好,他不断和大模型(如ChatGPT)对话,尝试改进代码或修复bug。

大模型给出的初版答案往往并不完美,于是研究者又会根据结果提出新的修改意见。就这样一来一回,经过不断交互,代码逐渐被打磨得完善。

这种「和大模型互动、改进算法」的方式,已经成为地理研究的常见操作。

那问题来了:能不能更进一步?——让这种交互—改进的过程自动发生,让AI不再只是帮手,而是真正像科学家一样,自己去进化地理模型?

MIT和斯坦福学者提出了GeoEvolve,尝试了这样一种探索:

🌍把地理知识「嵌入」AI,让它的进化更靠谱、更接近地理学原理;

🤖让大模型不只是辅助工具,而是成为能够自主改进算法的「科研合作者」。

传送门:https://arxiv.org/abs/2509.21593

项目地址:https://vezarachan.github.io/GeoEvolveWebPage/

GeoEvolve 已经开源为 Python 包,可直接安装使用(pip install geoevolve)。

研究背景

地理空间建模是理解气候变化、推动城市可持续发展的关键工具

但传统方法往往依赖专家经验:提出假设、设计算法、不断调参改进。

近年来,大语言模型(LLMs)展现了自动进化代码的潜力。比如Google最新推出的AlphaEvolve,就能让AI自己尝试、变异、优化算法。

然而,这类系统有一个天然短板——它们并不懂地理。如果完全放任AI去进化,很容易「跑偏」,生成的模型缺乏地理学上的合理性。

正因如此,GeoEvolve的提出构建了一个结合AI自主进化与地理知识引导的新框架。

GeoEvolve框架

如图1所示,可以把GeoEvolve想象成一个「由导师和博士生组成的GeoAI研究团队」:

内循环:AI扮演博士生,基于初始代码,互相交流,不断试错、生成和改进算法;

外循环:一个「导师」——地理知识库(GeoKnowRAG)在旁提醒,确保演化方向符合空间理论。

GeoEvolve的四个核心模块分别是:

代码进化器(自动生成和变异候选算法),

代码分析器(诊断问题、提出改进思路),

地理知识检索器(GeoKnowRAG,提供空间学理论与经典方法),

知识驱动提示生成器(把复杂的地理知识转化为AI能理解的优化指令)。

通过这套双循环机制,GeoEvolve不仅能写代码,更能逐渐学会像地理学家一样思考。

整个GeoEvolve的输入,只有三样:

原始模型——需要改进的地理模型(甚至可以是一张「白纸」的空白模型);

评价指标——衡量模型优劣的标准(比如RMSE、MAE);

提示语——给大模型的一句话任务说明(例如:「请帮我改进这个Kriging模型」)。

图1.GeoEvolve所依赖的基本思想,地理知识引导下的算法进化。虚线框表示通用的算法生成引擎(例如AlphaEvolve)。外部流程展示了本文提出的知识引导型算法生成方法,专门面向地理空间建模场景。

图2展示了GeoEvolve详细的框架。

GeoEvolve旨在通过结合进化式代码生成与结构化地理空间知识,实现地理空间模型的自动发现。

与通用的代码智能体不同,GeoEvolve融合了来自空间建模文献与经典算法的领域知识,从而能够探索并发现新的地理空间算法。

它由四个主要部分组成:(1)代码进化器,(2)演化代码分析器,(3)地理知识检索器,以及(4)知识驱动提示生成器。

这些组件共同构成了一个闭环的代码生成、评估与改进过程,从而推动地理空间模型的自动化发现。

图2.GeoEvolve的框架

如图3所示,为了避免AI在进化过程中「跑偏」,GeoEvolve引入了一个专门的地理知识检索模块(GeoKnowRAG)。

它相当于一个「地理知识库」,收集了来自Wikipedia、arXiv和GitHub的核心资料,包括空间自相关、异质性、Kriging、地理加权回归等经典概念与算法。

系统会把这些知识转化为结构化数据库,并在AI进化时调用,通过智能检索与融合(RAG-Fusion),为代码生成提供有理论支撑的提示。

这样,AI就能在「懂地理」的前提下进行算法改进,确保进化出的模型既聪明又可靠。

图3.GeoKnowRAG的框架

案例研究:对Kriging的自动化改进

Ordinary Kriging是地质统计学中最经典的空间插值方法,被广泛应用于环境监测、气候分析和资源勘探。

但它的核心算法提出已久,后续研究更多是「外挂式」的结合,比如与回归模型结合形成regression kriging,而对Kriging本身结构的改进几乎没有新的突破。

GeoEvolve得到的全新Kriging model

在实验中,GeoEvolve在保留Kriging核心的基础上,通过进化和知识引导自动注入了多项改进,仅选取几个为例展示:

自适应经验变差图估计

原始方法用固定分箱,容易受异常值影响。

GeoEvolve借鉴统计学方法,引入Silverman分箱规则、分位数分箱和截尾均值,自动确定合适的区间数量。

多起点全局拟合

传统拟合容易陷入局部最优。

GeoEvolve用多起点优化+L1或加权最小二乘,保证参数物理意义合理(如变程不为负)。

自适应数据变换

在数据偏态严重时,GeoEvolve会自动选择合适的对数变换+偏移量,保证残差分布更合理,预测更稳定。

上述改进如果单独来看,也许只是一些「渐进式增强」;但当它们被GeoEvolve自动组合、进化,并在真实实验中显著提升预测精度时,就展现出强大的效果。

将GeoEvolve-Kriging与其他自动化算法发现的Kriging模型进行对比,选取澳大利亚某矿区的铜(Cu)、铅(Pb)、锌(Zn)预测作为实验场景。

如表格所示,结果差异十分明显:

原始Kriging:表现最差,预测误差最高;

OpenEvolve-Kriging:在部分指标上有所改善,但在锌元素预测中反而退步;

加入地理知识提示的OpenEvolve:并没有带来额外提升,说明缺乏针对性的知识很难真正帮助算法演化;

GeoEvolve(无知识库版本):已经显著优于OpenEvolve,但仍不及完整版本;

完整GeoEvolve-Kriging:始终表现最佳,在三种金属元素的预测中都取得了最低RMSE和MAE。

具体来说,GeoEvolve相比OpenEvolve-Kriging,RMSE分别降低了11.3%(Cu)、20.9%(Pb)、13.5%(Zn);相较于原始Kriging,降低幅度更是达到15.4%、21.2%、13.0%。

这清楚地表明,结构化的地理知识库(GeoKnowRAG)在算法进化中起到了关键作用,让AI不仅能写出代码,更能在「懂地理」的前提下进化出更强的插值模型。

总结

GeoEvolve的实验结果告诉我们:AI不只是会修改代码,它还可以在地理学知识的引导下,自主进化出更强的经典模型。这意味着:

未来的地理建模,不一定总是研究人员「手工设计」,然后基于LLMs进行修改;

我们可以让算法开发过程完全自动化,让AI不断试错、吸收知识,最终学会像地理学家一样思考;

GeoEvolve展示了一条通向可信赖的GeoAI的新道路,也为AI-for-Science在地理科学和可持续发展中的应用打开了可能。

或许在不久的将来,AI将不仅是工具,更是科研合作者。

参考资料:

Luo,P.,Lou,X.,Zheng,Y.,Zheng,Z.andErmon,S.,2025.GeoEvolve: Automating Geospatial Model Discovery via Multi-Agent Large Language Models. arXiv preprint arXiv:2509.21593

本文来自微信公众号“新智元”,作者:新智元,编辑:KingHZ,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

GeoEvolve 地理空间模型 AI进化 大模型 Kriging 自动化建模 GeoAI MIT Stanford Geospatial Models AI Evolution Large Language Models Automated Modeling
相关文章