当前位置：首页 > 科技资讯 > 正文

GeoEvolve：AI驱动的地理模型自主进化系统

主机测评网
科技资讯
2026-01-14
238

地理科研人员的日常工作常涉及与大型语言模型互动，以优化地理模型代码或修正错误。

初始模型输出往往不够完善，研究者据此提出调整建议，通过多次迭代使代码逐步精炼。

这种通过AI交互改进算法的方式，已在地理研究中成为标准实践。

问题随之产生：能否将此类交互改进过程自动化，使AI从辅助角色转变为能自主进化地理模型的科学家？

MIT与斯坦福的研究者推出了GeoEvolve，进行了如下探索：

🌍将地理知识整合到AI中，使其进化更可靠、更贴合地理学原理；

🤖让大模型不仅是工具，而是能自主改进算法的科研合作伙伴。

GeoEvolve：AI驱动的地理模型自主进化系统 GeoEvolve 地理空间建模 AI算法进化知识引导演化第1张

论文链接：https://arxiv.org/abs/2509.21593

项目主页：https://vezarachan.github.io/GeoEvolveWebPage/

GeoEvolve已开源为Python包，可直接安装使用（pip install geoevolve）。

研究背景

地理空间建模是理解气候变化、促进城市可持续发展的核心工具。

但传统方法依赖于专家经验：提出假设、设计算法、持续调整参数。

近年来，大语言模型展现了自动进化代码的潜力。例如Google推出的AlphaEvolve，使AI能够自我尝试、变异并优化算法。

然而，这类系统存在固有缺陷——缺乏地理知识。若放任AI自由进化，易偏离正轨，导致模型在地理学上不合理。

正因此，GeoEvolve构建了一个融合AI自主进化与地理知识引导的新框架。

GeoEvolve框架

如图1所示，GeoEvolve可类比为由导师和博士生组成的GeoAI研究团队：

内循环：AI扮演博士生角色，基于初始代码相互交流，通过试错不断生成和改进算法；

外循环：一个「导师」——地理知识库（GeoKnowRAG）从旁指导，确保演化方向符合空间理论。

GeoEvolve的四个核心模块包括：

代码进化器（自动生成和变异候选算法），

代码分析器（诊断问题、提出优化思路），

地理知识检索器（GeoKnowRAG，提供空间学理论与经典方法），

知识驱动提示生成器（将复杂地理知识转化为AI可理解的指令）。

通过这套双循环机制，GeoEvolve不仅能编写代码，还能逐渐学会像地理学家一样思考。

整个GeoEvolve的输入仅有三项：

原始模型——需改进的地理模型（甚至可以是空白模型）；

评价指标——衡量模型优劣的标准（如RMSE、MAE）；

提示语——给大模型的任务说明（例如：「请优化这个Kriging模型」）。

GeoEvolve：AI驱动的地理模型自主进化系统 GeoEvolve 地理空间建模 AI算法进化知识引导演化第2张

图1. GeoEvolve的基本理念：地理知识引导下的算法进化。虚线框表示通用算法生成引擎（如AlphaEvolve）。外部流程展示了本文提出的知识引导型算法生成方法，专为地理空间建模场景设计。

图2展示了GeoEvolve的详细框架。

GeoEvolve旨在通过结合进化式代码生成与结构化地理空间知识，实现地理空间模型的自动发现。

与通用代码智能体不同，GeoEvolve融合了空间建模文献与经典算法的领域知识，从而能探索并发现新的地理空间算法。

它由四个主要部分组成：(1)代码进化器，(2)演化代码分析器，(3)地理知识检索器，以及(4)知识驱动提示生成器。

这些组件共同构成一个闭环的代码生成、评估与改进过程，推动地理空间模型的自动化发现。

GeoEvolve：AI驱动的地理模型自主进化系统 GeoEvolve 地理空间建模 AI算法进化知识引导演化第3张

图2. GeoEvolve的框架

如图3所示，为避免AI在进化过程中偏离，GeoEvolve引入了专门的地理知识检索模块（GeoKnowRAG）。

它相当于一个「地理知识库」，收集了来自Wikipedia、arXiv和GitHub的核心资料，涵盖空间自相关、异质性、Kriging、地理加权回归等经典概念与算法。

系统将这些知识转化为结构化数据库，并在AI进化时调用，通过智能检索与融合（RAG-Fusion），为代码生成提供理论支撑的提示。

这样，AI就能在理解地理的前提下进行算法改进，确保进化出的模型既智能又可靠。

GeoEvolve：AI驱动的地理模型自主进化系统 GeoEvolve 地理空间建模 AI算法进化知识引导演化第4张

图3. GeoKnowRAG的框架

案例研究：Kriging的自动化改进

普通Kriging是地质统计学中最经典的空间插值方法，广泛应用于环境监测、气候分析和资源勘探。

但其核心算法提出已久，后续研究多侧重于外部结合，如与回归模型形成回归Kriging，而对Kriging本身结构的改进鲜有突破。

GeoEvolve生成的全新Kriging模型

在实验中，GeoEvolve在保留Kriging核心的基础上，通过进化与知识引导自动引入了多项改进，以下举例说明：

自适应经验变差图估计

原始方法使用固定分箱，易受异常值干扰。

GeoEvolve借鉴统计学方法，引入Silverman分箱规则、分位数分箱和截尾均值，自动确定合适区间数量。

多起点全局拟合

传统拟合易陷入局部最优。

GeoEvolve采用多起点优化结合L1或加权最小二乘，确保参数物理意义合理（如变程非负）。

自适应数据变换

在数据偏态严重时，GeoEvolve会自动选择对数变换加偏移量，使残差分布更合理，预测更稳定。

这些改进单独看或许是渐进式增强，但当它们被GeoEvolve自动组合、进化，并在真实实验中显著提升预测精度时，便展现出强大效果。

将GeoEvolve-Kriging与其他自动化算法发现的Kriging模型对比，以澳大利亚某矿区的铜（Cu）、铅（Pb）、锌（Zn）预测为例。

如表所示，结果对比鲜明：

GeoEvolve：AI驱动的地理模型自主进化系统 GeoEvolve 地理空间建模 AI算法进化知识引导演化第5张

原始Kriging：表现最差，预测误差最高；

OpenEvolve-Kriging：在部分指标上有所改善，但在锌元素预测中性能下降；

加入地理知识提示的OpenEvolve：未带来额外提升，说明缺乏针对性知识难以有效助益算法演化；

GeoEvolve（无知识库版本）：已显著优于OpenEvolve，但仍不及完整版本；

完整GeoEvolve-Kriging：始终表现最佳，在三种金属元素的预测中均取得最低RMSE和MAE。

具体而言，GeoEvolve相比OpenEvolve-Kriging，RMSE分别降低11.3%（Cu）、20.9%（Pb）、13.5%（Zn）；相较于原始Kriging，降低幅度达15.4%、21.2%、13.0%。

这清晰表明，结构化的地理知识库（GeoKnowRAG）在算法进化中起关键作用，让AI不仅能编写代码，还能在懂地理的前提下进化出更强插值模型。

总结

GeoEvolve实验结果揭示：AI不仅会修改代码，还能在地理学知识引导下自主进化出更优经典模型。这意味着：

未来地理建模不一定总依赖研究人员手工设计再借助LLMs修改；

算法开发过程可完全自动化，让AI通过试错吸收知识，最终学会像地理学家一样思考；

GeoEvolve为可信GeoAI开辟了新道路，也为AI-for-Science在地理科学和可持续发展中的应用提供了可能。

或许在不久的将来，AI将不仅是工具，更是科研合作者。

参考资料：

Luo, P., Lou, X., Zheng, Y., Zheng, Z. and Ermon, S., 2025. GeoEvolve: Automating Geospatial Model Discovery via Multi-Agent Large Language Models. arXiv preprint arXiv:2509.21593