AI & Big Data 10月07日 13:45
OpenAI发布AgentKit,加速AI代理人开发与部署
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI在今年的开发者大会Dev Day上发布了AgentKit,一套旨在帮助开发者更快地开发、部署和优化AI代理人的综合工具。AgentKit建立在Response API和Agents SDK的基础上,解决了过去开发AI代理人时需要手动整合零散工具、版本控制混乱、自定义连接器困难以及手动评估管理等痛点。通过AgentKit,开发者可以使用Agent Builder进行可视化工作流设计,利用Connector Registry集中管理数据和工具连接,并通过ChatKit轻松将定制化的聊天代理人嵌入到应用程序或网站中。此外,OpenAI还强化了Eval评估工具,支持端到端评估和自动优化提示,并提供强化式微调(RFT)功能,允许开发者定制OpenAI推理模型,目前已在o4-mini和GPT-5的private beta版本中可用。

🚀 **AgentKit的推出简化AI代理人开发流程**:OpenAI发布的AgentKit是一套集成的开发、部署和优化AI代理人的工具。它解决了过去开发AI代理人时遇到的手动整合零散工具、版本控制、自定义连接器以及评估管理等复杂问题,显著缩短了开发周期,并提升了效率。

🧩 **AgentKit的核心组件提升开发灵活性**:AgentKit包含Agent Builder、Connector Registry和ChatKit三大组件。Agent Builder提供了一个可视化的工作区,允许开发者通过拖拉节点和连接工具来设计多代理人工作流,并支持版本管理和自定义评估。Connector Registry则实现了对跨产品数据和工具连接的集中管理,支持与第三方系统的集成。ChatKit则简化了将定制化聊天代理人嵌入到应用程序中的过程。

📊 **Eval评估工具的增强提升代理人性能**:OpenAI通过为Eval评估工具新增四项功能,进一步提升了对代理人性能的测试和衡量能力。这些新功能支持从头开始构建代理人评估、进行端到端工作流评估、根据评分点出缺点,并能根据人类标注和评分器结果自动优化提示,同时支持评估OpenAI及第三方模型。

🛠️ **强化式微调(RFT)提供模型定制化能力**:OpenAI提供的强化式微调(RFT)功能允许开发者定制OpenAI的推理模型,目前已在o4-mini上可用,并在GPT-5的private beta版本中提供。RFT的新功能包括呼叫自定义工具以及为评估自定义评分器,进一步增强了模型的适应性和实用性。

OpenAI本周一在今年開發者大會Dev Day上公布代理人開發工具AgentKit,可協同開發人員更快開發並部署AI代理人,並強化相關的Eval評估工具及微調工具。

AgentKit 是一套完整的工具,可讓開發商及企業開發、部署和優化代理人。OpenAI三月釋出Responses API和Agents SDK,獲得許多開發人員和企業用來建立代理人workflow,以開發深度研究或客服支援應用。AgentKit則是在Responses API基礎上發展而成,旨在提供整合的代理人開發部署工具。

OpenAI表示,過去開發代理人需要開發商自行蒐羅及整合零散的工具,是一沒有版本控管、自訂連接器、手動評估管理、自行調整提示的繁複作業,往往推出前需耗時好幾星期。有了AgentKit,開發人員可以利用其開發構件,以視覺介面設計工作流(workflow),且更快嵌入代理人UI。

AgentKit的構件包括Agent Builder、Connector Registry及ChatKit。其中Agent Builder為建立多代理人workflow及管理版本的視覺化工作區(canvas),使用者利用拖拉節點、連結工具來建立控制邏輯,還能設定自己的護欄。它並支援預覽執行、自訂inline評估、及完整的版本管理。

Connector Registry為管理員管理跨所有OpenAI產品資料和工具連結的中央介面。它能將ChatGPT和API的資料源整合到單一管理介面。其註冊中心(registry)還能透過預建的連接器,讓代理人連第三方系統如Dropbox、Google Drive、SharePoint和Microsoft Teams及MCP伺服器。

ChatKit則能把可客製化聊天代理人嵌入到開發出的應用程式的工具組。OpenAI說,部署代理人聊天 UI其實挺複雜的,需要處理串流的回應、管理對話串,顯示模型思考過程和設計吸引人的聊天體驗。ChatKit則可把這些代理人輕鬆嵌入到開發商或企業自己的App或網站,使其符合主題和公司品牌。

為測試代理人效能,OpenAI也強化了評估工具。去年該公司推出的評估工具Eval提供提示測試和衡量模型行為。本周OpenAI再為Eval加入4項新功能,包括針對資料集,快速從頭打造代理人評估,且可隨時間改進;對代理人workflow執行端到端的評估,並以評分點出缺點。它還會根據人類標註和評分器結果自動優化提示。這個評估工具不只評估OpenAI的模型,也支援第三方模型。

OpenAI還提供強化式微調(reinforcement fine-tuning, RFT),讓開發人員客製化OpenAI的推理模型。現在可在OpenAI o4-mini 上使用,並在GPT-5以private beta提供。OpenAI正和數十家客戶合作改善GPT-5的RFT功能。

目前RFT有二項新功能和改善代理人有關,包括呼叫自訂工具和為評估自訂評分器。

在推出時程上,即日起ChatKit和新版評估(Evals)全面提供給所有開發人員。AgentBuilder目前為Beta版,Connector Registry以Beta版部署到部份API、以及具有Global Admin Console的ChatGPT Enterprise和Edu客戶。

OpenAI計畫很快會將獨立的Workflows API及代理人部署選項加到ChatGPT。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI AgentKit AI代理人 开发工具 AI开发 Dev Day Agent Builder Connector Registry ChatKit Eval RFT Reinforcement Fine-Tuning AI agents developer tools AI development
相关文章