OpenAI发布AgentKit，加速AI代理人开发与部署

AI & Big Data 10月07日 13:45

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

OpenAI在今年的开发者大会Dev Day上发布了AgentKit，一套旨在帮助开发者更快地开发、部署和优化AI代理人的综合工具。AgentKit建立在Response API和Agents SDK的基础上，解决了过去开发AI代理人时需要手动整合零散工具、版本控制混乱、自定义连接器困难以及手动评估管理等痛点。通过AgentKit，开发者可以使用Agent Builder进行可视化工作流设计，利用Connector Registry集中管理数据和工具连接，并通过ChatKit轻松将定制化的聊天代理人嵌入到应用程序或网站中。此外，OpenAI还强化了Eval评估工具，支持端到端评估和自动优化提示，并提供强化式微调（RFT）功能，允许开发者定制OpenAI推理模型，目前已在o4-mini和GPT-5的private beta版本中可用。

🚀 **AgentKit的推出简化AI代理人开发流程**：OpenAI发布的AgentKit是一套集成的开发、部署和优化AI代理人的工具。它解决了过去开发AI代理人时遇到的手动整合零散工具、版本控制、自定义连接器以及评估管理等复杂问题，显著缩短了开发周期，并提升了效率。

🧩 **AgentKit的核心组件提升开发灵活性**：AgentKit包含Agent Builder、Connector Registry和ChatKit三大组件。Agent Builder提供了一个可视化的工作区，允许开发者通过拖拉节点和连接工具来设计多代理人工作流，并支持版本管理和自定义评估。Connector Registry则实现了对跨产品数据和工具连接的集中管理，支持与第三方系统的集成。ChatKit则简化了将定制化聊天代理人嵌入到应用程序中的过程。

📊 **Eval评估工具的增强提升代理人性能**：OpenAI通过为Eval评估工具新增四项功能，进一步提升了对代理人性能的测试和衡量能力。这些新功能支持从头开始构建代理人评估、进行端到端工作流评估、根据评分点出缺点，并能根据人类标注和评分器结果自动优化提示，同时支持评估OpenAI及第三方模型。

🛠️ **强化式微调（RFT）提供模型定制化能力**：OpenAI提供的强化式微调（RFT）功能允许开发者定制OpenAI的推理模型，目前已在o4-mini上可用，并在GPT-5的private beta版本中提供。RFT的新功能包括呼叫自定义工具以及为评估自定义评分器，进一步增强了模型的适应性和实用性。

OpenAI本周一在今年開發者大會Dev Day上公布代理人開發工具AgentKit，可協同開發人員更快開發並部署AI代理人，並強化相關的Eval評估工具及微調工具。

AgentKit 是一套完整的工具，可讓開發商及企業開發、部署和優化代理人。OpenAI三月釋出Responses API和Agents SDK，獲得許多開發人員和企業用來建立代理人workflow，以開發深度研究或客服支援應用。AgentKit則是在Responses API基礎上發展而成，旨在提供整合的代理人開發部署工具。

OpenAI表示，過去開發代理人需要開發商自行蒐羅及整合零散的工具，是一沒有版本控管、自訂連接器、手動評估管理、自行調整提示的繁複作業，往往推出前需耗時好幾星期。有了AgentKit，開發人員可以利用其開發構件，以視覺介面設計工作流（workflow），且更快嵌入代理人UI。

AgentKit的構件包括Agent Builder、Connector Registry及ChatKit。其中Agent Builder為建立多代理人workflow及管理版本的視覺化工作區（canvas），使用者利用拖拉節點、連結工具來建立控制邏輯，還能設定自己的護欄。它並支援預覽執行、自訂inline評估、及完整的版本管理。

Connector Registry為管理員管理跨所有OpenAI產品資料和工具連結的中央介面。它能將ChatGPT和API的資料源整合到單一管理介面。其註冊中心（registry）還能透過預建的連接器，讓代理人連第三方系統如Dropbox、Google Drive、SharePoint和Microsoft Teams及MCP伺服器。

ChatKit則能把可客製化聊天代理人嵌入到開發出的應用程式的工具組。OpenAI說，部署代理人聊天 UI其實挺複雜的，需要處理串流的回應、管理對話串，顯示模型思考過程和設計吸引人的聊天體驗。ChatKit則可把這些代理人輕鬆嵌入到開發商或企業自己的App或網站，使其符合主題和公司品牌。

為測試代理人效能，OpenAI也強化了評估工具。去年該公司推出的評估工具Eval提供提示測試和衡量模型行為。本周OpenAI再為Eval加入4項新功能，包括針對資料集，快速從頭打造代理人評估，且可隨時間改進；對代理人workflow執行端到端的評估，並以評分點出缺點。它還會根據人類標註和評分器結果自動優化提示。這個評估工具不只評估OpenAI的模型，也支援第三方模型。

OpenAI還提供強化式微調（reinforcement fine-tuning， RFT），讓開發人員客製化OpenAI的推理模型。現在可在OpenAI o4-mini 上使用，並在GPT-5以private beta提供。OpenAI正和數十家客戶合作改善GPT-5的RFT功能。

目前RFT有二項新功能和改善代理人有關，包括呼叫自訂工具和為評估自訂評分器。

在推出時程上，即日起ChatKit和新版評估（Evals）全面提供給所有開發人員。AgentBuilder目前為Beta版，Connector Registry以Beta版部署到部份API、以及具有Global Admin Console的ChatGPT Enterprise和Edu客戶。

OpenAI計畫很快會將獨立的Workflows API及代理人部署選項加到ChatGPT。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签