知乎全站热榜 01月24日
OpenAI 发布 AI 智能体 Operator,能像人类一样自主操控浏览器,有哪些技术亮点?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI发布了AI智能体Operator,它能像人类一样操作网页,执行购买杂货、预订餐厅等任务。与其他智能体不同,Operator通过CUA系统进行复杂的思维链反思和步骤规划,提高了任务完成的精度和复杂性。它无需对具体任务进行精调,就能泛化完成多种复杂任务。在用户测试中,Operator甚至能完成论文分类搜索和综述整理等复杂工作。目前,Operator以“研究预览”形式向美国ChatGPT Pro用户开放,未来将逐步推广到更多用户。OpenAI正与多家科技公司合作,使用户在Operator主页上更便捷地访问这些公司的网页。

🤖 OpenAI发布Operator智能体,能像人一样操作网页,完成复杂任务。

🧠 Operator采用CUA系统,具备复杂的思维链反思和步骤规划能力,无需精调即可处理多种任务。

🌐 Operator不仅能完成网购、订餐等基础操作,还能进行论文分类搜索和综述整理等复杂工作。

🚀 Operator目前以研究预览形式向美国ChatGPT Pro用户开放,未来将逐步推广到更多用户。

🤝 OpenAI正与多家科技公司合作,使用户在Operator主页上更便捷地访问这些公司的网页。

1月24日消息,OpenAI在北京时间凌晨举行直播活动,发布了市场期待已久的AI智能体Operator(意为操作员),它能够代理用户执行基于网页的操作,像人类一样点击、滚动和输入文字,完成诸如购买杂货、预订餐厅以及提交费用报告等任务。 在此之前,包括微软、Salesforce和Workday等商业软件公司纷纷推出了各自的智能体。谷歌和人工智能初创公司Anthropic近期也推出了类似的智能体工具,它们与OpenAI的Operator相似,能够浏览网页并与菜单和按钮进行交互。 但Operator的特点是,与其他各家Agent相比,它会通过CUA的系统进行复杂的思维链反思和步骤规划。这可以大大提高其完成任务的精度和复杂性。在不依靠对具体任务进行精调的情况下,Operator就能泛化的完成多种复杂任务。虽然在直播的实机演示中,OpenAI仅仅展示了网购、订餐等基础操作。但在后续的部分用户测试中,它甚至可以完成在Arxiv上进行论文分类搜索,阅读多篇论文并完成综述整理的复杂工作。而且这个工作肯定是不太可能被纳入传统精调过的“意图理解”框架内的。 另外,CUA本身在网页控制和系统控制方面也达到了SOTA。虽然仍和人类有相当差距,但在演示中整体行动相当流畅。 目前,OpenAI的“Operator”智能体以“研究预览”(research preview)的形式向美国的ChatGPT Pro用户开放。这一阶段表明该产品仍处于发展初期,可能存在局限性,在演进过程中可能会出现错误。ChatGPT Pro的订阅费用为每月200美元,该服务专为需要高级AI功能的专业用户设计,提供无限制访问包括GPT-4o和o1在内的高级模型。 OpenAI表示,计划将Operator功能逐步推广到ChatGPT的Plus、Team和Enterprise用户。在直播活动中,OpenAI首席执行官山姆·奥特曼(Sam Altman)提到,Operator功能将很快在其他国家推出,但欧洲地区可能需要更长时间。 OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)表示,Operator能够在家庭和工作中节省时间,尤其是在自动化常见任务方面存在“巨大潜力”。”他指出:“Operator从根本上改变了人们与计算机的交互方式。这是一个艰巨的技术挑战,其价值取决于它的实用性。” 此外,OpenAI正在与包括Instacart、Uber、eBay、Priceline、OpenTable和Etsy在内的科技公司合作,以便让用户在Operator主页上更便捷地访问这些公司的网页。OpenAI发布AI智能体Operator,能像人类一样自主操控浏览器_腾讯新闻

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI Operator AI智能体 CUA 人机交互
相关文章