新智元 10月27日 22:03
UCL团队开源Prometheus智能体,以低成本实现高效率代码修复
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

伦敦大学学院(UCL)的初创团队EuniAI发布了开源AI软件智能体Prometheus。该系统在SWE-bench Verified上实现了71.2%的Pass@1成功率,并已被官方榜单确认。Prometheus通过Neo4J知识图谱技术让AI“读懂代码”,实现自动修复错误、验证补丁并生成提交说明。其技术亮点包括统一知识图谱和多智能体协作框架,支持主流编程语言,且平均API成本低至0.23美元/issue。团队致力于让AI成为理解项目结构、独立调试和修复的工程伙伴。

💡 **Prometheus AI智能体实现高精度代码修复:** 来自UCL的EuniAI团队开源的Prometheus智能体,在SWE-bench Verified基准测试中取得了71.2%的Pass@1成功率,这一成绩已被官方确认并合并至主榜单。该系统通过先进的知识图谱技术,使得AI能够深入理解代码结构,从而实现自动检测、修复软件错误并验证修复补丁,展现了学术研究在AI工程领域的产业级突破。

🌐 **技术创新驱动代码理解与修复:** Prometheus的核心技术在于其“统一知识图谱”和“多智能体协作框架”。前者将代码结构、文件信息、抽象语法树等整合为可推理的知识网络,实现了对代码的深度理解和跨文件依赖分析;后者则由六个专职Agent协同工作,覆盖了从问题分类到补丁生成和验证的整个开发闭环,确保了端到端的自动化修复能力。

💰 **低成本高性能的AI工程解决方案:** Prometheus采用DeepSeek-V3模型,其性能接近GPT-4o,但API成本仅为其九分之一,平均每修复一个issue的成本低至0.23美元。此外,该系统支持在笔记本级硬件上运行完整的修复流程,极大地降低了AI代码修复的门槛,提高了可复现性,使其成为开发者和研究机构的理想选择。

🚀 **面向未来的AI工程伙伴愿景:** EuniAI团队的目标是让AI不仅仅是代码编写或修复工具,而是成为能够理解整个软件生态、独立调试和修复问题的工程伙伴。未来的发展计划包括增强智能修复代理、代码库结构化为知识图谱、项目记忆与学习能力,以及自动化构建与验证流程,旨在构建下一代代码理解与自动修复平台。


  新智元报道  

编辑:KingHZ
【新智元导读】学界杀入主赛道!UCL 校园团队 EuniAI 抛出开源智能体 Prometheus,在 SWE-bench Verified 上 71.2% Pass@1、主榜实锤合并;成本低至 $0.23/issue。
来自伦敦大学学院(UCL)的初创团队EuniAI开源发布了AI软件智能体Prometheus

该系统在SWE-bench Verified上取得71.2%的Pass@1成功率,成绩已被官方确认并合并至主榜单。

令人瞩目的是,这一成果来自高校科研团队,却已与产业巨头同台竞技,展现出学术研发在AI工程领域的产业级突破。

从学术论文到全球榜单高校科研的「产业级突破」Prometheus源自论文:

论文地址:https://arxiv.org/abs/2507.19942

开源代码:https://github.com/EuniAI/Prometheus

官网Demo:https://euni.ai/

官方榜单确认:https://github.com/SWE-bench/experiments/pull/339

它不仅通过开源代码和Neo4J知识图谱技术,让AI「读懂代码」,还能在实际GitHub项目中实现自动修复错误、验证补丁,甚至生成可直接提交的修复说明。

🔥全球榜单:成绩亮眼SWE-bench Verified:71.2% Pass@1(官方确认 merge)

SWE-bench Lite:35.33% Pass@1(开源模型SOTA)

平均API成本:仅$0.23/issue

技术亮点:让AI真正「理解」代码结构Prometheus的突破在于:它不是提示工程的产物,而是图结构推理的系统性设计。

统一知识图谱(Unified Knowledge Graph将代码结构整合文件结构、AST抽象语法树和文档信息,将复杂代码库转化为可推理的知识网络,实现多语言语法理解与跨文件依赖分析。

多智能体协作框架(Multi-Agent System)包含六个专职Agent,从问题分类、环境重现到补丁生成与验证,实现端到端自动化开发闭环。

跨语言与可扩展性覆盖Python、Java、Rust、C/C++、Go、TypeScript、PHP、Ruby等主流语言,支持真实世界项目自动构建与测试。

低成本+高可复现性 Prometheus使用DeepSeek-V3模型,性能与GPT-4o相近,但成本仅为其1/9。支持在笔记本级硬件上运行完整修复流程。

在线Demo从论文到真实工程的桥梁为展示Prometheus的工程化能力,EuniAI团队在官网上线了交互式演示平台:👉https://euni.ai/

该平台支持用户直接连接项目,选择待修复任务,系统将自动完成以下全自动流程操作:

自动环境构建与依赖安装

问题分析与知识图谱检索

补丁生成与自动验证

结果可视化与差异对比(Diff View)

目前Demo版本支持Python与多语言项目,提供限量邀请码注册体验,并持续向学术机构与开发者开放内测合作。

我们希望AI不再只是「补代码」,而是理解项目结构、能独立调试和修复的工程伙伴。  ——EuniAI团队


EuniAI团队由UCL助理教授叶荷(HeYe)领衔,成员来自伦敦大学学院、KTH皇家理工学院和CMU等国际高校。

他们以「科研与开源并行」的方式,推动AI智能体真正落地,让学术创新真正服务于软件开发一线。

未来展望EuniAI团队对下一代智能代码分析与自动修复系统的展望:

Prometheus的愿景,是让AI不仅写代码、修代码,更能理解整个软件生态,并与人类工程师共同进化。」

未来,EuniAI团队计划让Prometheus拥有更强的「工程意识」:

智能修复代理(Issue Resolution Agent):自动检测、修复并提交补丁,实现端到端自动化修复。

知识图谱生成(Codebase → Graph):一键将代码库结构化,提升上下文检索与跨语言理解。

项目记忆与学习(Agent Memory + Post-Train Model):让智能体具备项目经验与长期记忆,不断自我优化。

自动构建与验证(Automated Build Agent):生成补丁后自动测试与验证,保障修复质量。

生态集成(MCP & TerminalAutomation):支持Model Context Protocol与终端自动化,构建完整的AI工程流水线。

Prometheus不止是一款智能体系统,它是下一代代码理解与自动修复平台的起点。

🚀立即体验Demo!👉https://euni.ai/

上传一个项目与待修复任务,见证AI从识别问题、生成补丁、到自动验证的全过程。

(限量邀请码正在开放中🔑)

参考资料:
https://arxiv.org/abs/2507.19942



文章原文

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Prometheus AI智能体 代码修复 开源 UCL EuniAI SWE-bench 知识图谱 低成本AI Prometheus AI Agent Code Repair Open Source UCL EuniAI SWE-bench Knowledge Graph Low-Cost AI
相关文章