钛媒体:引领未来商业与生活新知 10月14日 11:31
OpenAI构建AI超级系统:ChatGPT融合应用与Agent生态
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

OpenAI正通过ChatGPT构建一个AI时代的“Windows”系统,重点在于Apps in ChatGPT和Agent Kit。该公司还在算力领域进行巨额投资,旨在建立一个包含算力、模型和应用生态的三大基础设施。Apps in ChatGPT将AI助理与浏览器深度融合,允许用户在对话中实时调用第三方应用,尽管目前功能尚不完善,但预示着未来浏览器可能仅作为AI助理的操作台。AI助理将扮演管家角色,提供跨平台、长记忆、个性化服务,并形成新的账号体系。AgentKit的推出将降低AI工具创建门槛,加速App向Agent转化,最终实现用户在各种场景下都能使用的通用AI工具。

🚀 **构建AI超级系统,以ChatGPT为核心:** OpenAI正致力于围绕ChatGPT构建一个AI时代的“超级系统”,而非简单的“超级应用”。该系统旨在通过对话式交互,整合账号体系、开发生态和商业模式,让各类App和Agent运行在其铺设好的轨道上,核心在于Apps in ChatGPT和Agent Kit的推出,以及对算力基础设施的巨额投资,为AI大模型的进化和应用提供支撑。

🌐 **Apps in ChatGPT:AI助理与浏览器的深度融合:** 新推出的Apps in ChatGPT功能将AI助理与浏览器进行了前所未有的融合,允许用户在ChatGPT的对话界面中实时调用Booking.com、Canva等第三方应用。尽管目前体验尚显粗糙,仅能实现简单的搜索结果展示,但其长远目标是让浏览器成为辅助AI助理处理复杂任务的操作台,AI助理则承担起入口的角色,负责服务与信息的获取和分发。

🧠 **AI助理的角色重塑:管家、账号与跨平台服务:** OpenAI重新定义了AI助理的角色,将其视为能够统筹家中“工作人员”(即各类应用和服务)为主人提供服务的“管家”。未来的AI助理将横跨不同硬件端,具备自主可控的模型能力、长久记忆能力和庞大的用户体量,成为最懂用户喜好、掌握用户隐私信息的账号,并能智能判断信息共享与保护,提供连续性和个性化的跨场景服务。

🛠️ **AgentKit推动应用生态发展:** AgentKit的推出进一步降低了用户创建专业AI工具的门槛,支持可视化、零代码的AI工具开发。这一举措将加速传统App向Agent的转化,使得未来用户与AI的主要交互方式很可能变为与Agent对话,浏览器则可能演化为随时可唤起的看板,实时展示任务执行情况,从而构建一个更加丰富和智能的AI应用生态。

文 | 窄播,作者 | 李威

这是《窄播Weekly》的第68期,本期我们关注的商业动态是:OpenAI在今年的DevDay上更清晰地向我们展示了如何构建一个AI时代的超级系统。

上周用Sora 2引爆AI圈之后,本周OpenAI继续贡献了AI领域的两个热点话题。一个是在DevDay上公布的Apps in ChatGPT和Agent Kit,让大家看到了OpenAI准备如何围绕ChatGPT的对话式交互,去构建一个AI时代的「Windows」系统。另一个则是OpenAI在算力采购领域的大手笔投资,有估算认为采购总额已经接近1万亿美元。

就像OpenAI的CEO山姆·奥特曼在一档播客节目中所说,ChatGPT上线之后经历了两个关键的「惊喜」时刻,首先是用户增长和黏性都远超预期,其次则是科技巨头们没有及时跟进,给ChatGPT留出了建立竞争优势的空间。

也因此,在过去的两年多时间里,OpenAI得以稳步推进自己的战略布局。

这个布局的全景就是要构建起三个相互依存的AI基础设施:第一,通过大规模投资算力基础设施,掌握足够充裕的算力资源,支撑大模型的进化和应用;第二,通过不断优化,建立性能强悍的大模型家族,在核心技术层面保持领先优势;第三,依托算力和模型基础,推动构建以ChatGPT为核心的AI应用生态。

相比OpenAI在算力层面的投资,我们会更关注OpenAI将如何围绕ChatGPT构建奥特曼口中的一个「真正强大的AI超级系统」。这是普通用户更有直观感知,并且更能够给到当下国内的AI产品启发的一个层面。

其中,刚刚推出的Apps in ChatGPT尤其值得关注。这个功能将AI助理与浏览器进行了更深层次融合,探索了传统App与AI助理的结合,让用户可以像在电脑上浏览网页一样,在ChatGPT的对话中去实时唤起不同App。沿着这个路径发展下去,浏览器未来可能只会作为一个帮助AI助理处理复杂任务的操作台存在,其入口地位会被AI助理所承接。

这也可以说明,为什么奥特曼不愿用「超级App」,而是选择「超级系统」来描绘OpenAI的发展前景。因为OpenAI不是要为ChatGPT集成不同的功能,而是想围绕对话式交互,打造完善的账号体系、开发生态和商业模式,让App和Agent们都跑在OpenAI为其提前铺设好的轨道上。

现在,OpenAI在进一步探索,如何通过对话式的交互,实现服务与信息的获取与分发,真正扮演好入口的角色。

不成熟但有新意的Apps Inside ChatGPT

在OpenAI发布的信息中, Booking.com、Canva、Coursera、Expedia、Figma、Spotify、Zillow是首批参与App Inside ChatGPT的伙伴。并且,在今年晚些时候会公布开发者如何通过应用盈利的细节。

但当我打开ChatGPT体验App Inside ChatGPT功能时,发现这个功能目前只能完成一些简单和粗糙的操作,并没有如预想中那样可以支持更为复杂的操作。

参照OpenAI在发布会上的演示,我在ChatGPT的对话框中让Booking帮我找几家北京的、可以提供停车位的酒店。然后会弹出将ChatGPT与Booking进行连接的授权界面,点击确认后会显示正在调用App。然后就可以在聊天界面内嵌的Booking窗口中,看到几家酒店的推荐,每个酒店下面都会有跳转到Booking的链接。

当我再继续要求Booking给我介绍一家酒店的详细信息时,ChatGPT会显示目前不支持查看App内的酒店的详细信息,只能像之前一样整理成文字信息呈现在聊天界面中。这也就意味着,Booking在ChatGPT内的嵌入,目前还只能给我们提供一个以网页形态呈现的搜索结果,和之前的列表方式没有本质区别。

然后我又尝试了唤起Zillow和Spotify,前者的打开速度很慢,后者则没有成功唤起,依然是ChatGPT自己整理了一份文字歌单给我。

显然,OpenAI还需要一个过程来打消App们的顾虑,建立起一个共赢的生态,进而在ChatGPT内提供更丰富、深度的App能力。

奥特曼提到,OpenAI本来可以设计出更流畅的使用体验,但这会对合作伙伴极为不利,所以他们选择将用户引导进原生App中。

「用户明确指定要使用某类服务时,我们会主动推荐合作方;合作方接管交互界面并关联用户账户,确保用户能与原服务保持直接、透明的连接。这种方式或许在用户体验的流畅度上略有妥协,但从长远来看,更有利于整个行业的健康发展。」奥特曼表示。

重新理解AI助理

在OpenAI目前选择的这条路径下,作为AI助理的ChatGPT,扮演了最核心的角色。

所有的交互方式、开发工具和商业生态都是围绕这个核心来构建的。其中,对话是最主要的交互方式,未来点击、滑动可能只会作为辅助操作存在;开发工具则主要服务于应用生态的搭建;商业生态是开放的,可能会出现更多基于效果的分成机制。

这样的一个系统下,我们对于AI助理的理解会变得更为清晰。

第一,AI助理就是要扮演管家的角色,负责统筹这个家庭中的不同工作人员,为主人提供服务。用奥特曼的话说就是,AI助理的目标是提供单一且高效的AI服务,贯穿于用户的「整个生活轨迹并持续输出价值」。

这样的AI助理就需要横跨不同硬件端,有自主可控的模型能力,有长久记忆能力,以及拥有庞大用户体量。ChatGPT的全球周活跃用户数已经达到了8亿,规模入口能吸引更多产品和应用嵌入到ChatGPT当中。

第二,AI助理与浏览器的「主次关系」会变得更为明确。作为入口的AI助理会获得更大的主动性,浏览器则作为人与AI共用的操作台存在。Booking目前在聊天框内嵌入的就是一个网页,那未来可能会在聊天框内唤起更复杂的网页,让人和AI助理能够基于网页呈现进行更效率更高的对话。

长期来看,Apps Inside ChatGPT不能做到的复杂交互很可能会以Agent的形式在ChatGPT内实现。从App到Agent的发展,会很像微信小程序的发展过程,一开始垂类App只是将小程序作为功能简单的引流工具使用,但越往后小程序的功能就越与原生App相近。

OpenAI推出的AgentKit能够支持用户可视化、零代码创建专业AI工具。而Agent搭建门槛的降低会加快App转化成为Agent的过程。未来人们最主要的交互可能就是和Agent的对话。这时的浏览器可能会从操作台演化为一个随时可以被唤起的看板,能够实时展示不同任务的执行情况。

第三,AI助理就是一个账号体系。像ChatGPT这样的AI助理,会成为最懂用户喜好、掌握用户最多隐私信息的账号。奥特曼认为,AI助理未来可以智能判断用户的哪些信息可共享、哪些信息需予以保护,配合不同App和Agent,为用户提供更具连续性和个性化的体验。

并且,奥特曼还认为,C端和B端对AI的应用,会比外界预期的更快走向融合,最终用户将拥有一款能覆盖所有场景的通用AI工具。这个工具事实上就是OpenAI要建设的超级系统。在这个系统中,作为账号的ChatGPT能够及时适配工作场景与生活场景不同权限、能力要求的切换,并调用不同的能力完成任务。

如果参照奥特曼的构想来衡量国内的头部AI企业,会发现字节的豆包更明显地在构建一个完善的AI系统能力,阿里、百度、腾讯则都还处于四处出击的阶段,没有在AI助理和浏览器之间形成合力,也没有积极地围绕AI助理进行Agent生态建设,以及探索App与AI助理的融合。

但腾讯还存在微信这个变量。微信本身就具备了庞大的用户体量、小程序生态和商业能力,并且在手机端和PC端也实现了打通,其搜索框也在向AI搜索框进化。只是,目前微信中缺少了一个AI助理。一旦微信的AI助理上线,将会轻易改变AI助理的现有竞争格局。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

OpenAI ChatGPT AI超级系统 Apps in ChatGPT Agent Kit AI助理 浏览器 算力 人工智能 OpenAI ChatGPT AI Super System Apps in ChatGPT Agent Kit AI Assistant Browser Compute Power Artificial Intelligence
相关文章