36氪 - 科技频道 09月29日
顶尖AI科学家许主洪加盟阿里通义,聚焦大模型研发
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

全球顶尖AI科学家、IEEE Fellow许主洪已加盟阿里通义,投身大模型研发。他拥有超过20年的AI产业和学术经验,曾任Salesforce副总裁,构建了亚洲AI研究生态,并创立多模态AI创企HyperAGI。此次加盟阿里,他将负责AI To C业务的多模态基础模型及智能体研究与应用。此举被视为阿里在多模态大模型领域的重要人才布局,旨在加速其通义大模型的迭代和多模态发展,以应对全球AI领域的快速竞争。

🌟 **重磅人才加盟,聚焦前沿大模型研发:** 顶尖AI科学家许主洪(Steven Hoi)已确认加盟阿里通义,其超过20年的深厚AI产业及学术背景,包括斯坦福大学评选的全球顶尖1%AI科学家头衔,将为阿里在大模型研发领域注入强劲动力,尤其是在多模态大模型这一前沿方向。

💡 **产学研全能型专家,经验丰富:** 许主洪不仅是学术界的资深人士(曾任新加坡管理大学终身教授),在产业界也拥有丰富的领导经验,曾从零构建Salesforce亚洲AI研究生态,并创立了多模态AI初创公司HyperAGI。他横跨理论与实践的能力,对于推动阿里通义大模型的发展至关重要。

🚀 **战略重心转移,加速多模态布局:** 此前许主洪的定位侧重于AI To C业务的多模态基础模型及智能体研究与应用,而此次转向通义实验室团队,意味着阿里可能将战略重心进一步向更基础、更前沿的大模型研发倾斜,以应对全球AI模型快速迭代的竞争态势,并在多模态领域寻求新的突破。

🌐 **应对AI加速期,比拼迭代效率:** 随着AI进入加速期,模型迭代效率成为关键。阿里通义实验室负责人周靖人曾强调,通义家族一直在全球领先者中追赶,并认为模型从单模态向多模态演进是必然趋势。许主洪的加盟,正是为了在这一关键时期,为阿里在多模态大模型研发领域提供核心技术支持和战略领导力。

🚧 **攻克多模态技术挑战,展望AGI未来:** 许主洪在公开演讲中多次强调,统一理解与生成的多模态大模型面临全模态交互、理解与生成平衡等技术挑战,而多模态Agent AI时代才刚刚开始,距离通用人工智能(AGI)尚有诸多难题待解。他的加入,预示着阿里将致力于攻克这些技术难题,探索多模态大模型的未来潜力。

智东西9月29日消息,据“互联网八卦小喇叭”等媒体爆料,全球顶尖AI科学家、IEEE Fellow许主洪(Steven Hoi)已加盟阿里通义,转向通义大模型的相关研发工作。 

许主洪拥有超20年AI产业和学术经验,是新加坡管理大学终身教授、曾任新加坡南洋理工大学终身副教授,在AI领域发表了300多篇顶级学术论文,论文被引用超过5万次,曾被斯坦福大学评为全球顶尖1%的AI科学家之一。 

作为多模态大模型领域的领军人物,许主洪曾担任全球最大的企业软件公司Salesforce的副总裁,从零开始构建了Salesforce在亚洲的AI研究生态系统;他还于2023年创立了一家多模态AI创企HyperAGI,可以说是业内少有的产学研多栖AI大牛。 

▲许主洪

2025年2月,许主洪加入阿里并担任阿里集团副总裁、智能信息事业群首席科学家,向智能信息事业群总裁吴嘉汇报,负责AI To C业务的多模态基础模型及智能体(Agents)研究与应用。 

按原本的定位,许主洪的核心任务大概是组建顶级AI算法团队,整合通义(应用)、夸克、天猫精灵等内部资源,促进多模态交互产品迭代,加速AI To C商业化。 

在今年6月的2025上海世界移动通信大会上,许主洪发表题为《多模态大模型发展与演进》的演讲,在演讲中他以夸克App的AI超级框、AI相机等功能为例讲解了多模态大模型的应用场景。 

▲许主洪以夸克为例讲解多模态大模型应用场景

然而,在加入阿里7个多月后,许主洪传出加入通义实验室团队,这意味着他可能将从面向AI To C商业化研发转向更基础前沿的大模型研发。

如果消息属实,这意味着阿里完成了一次重大的人才重配,也标志阿里在多模态大模型研发领域再投重码。 

当下,阿里通义大模型正处于“拼迭代速度”、“多模态发展”的关键阶段,十分需要许主洪这样对口的顶尖产学研多栖且有分量的AI大牛坐镇。 

在9月底举办的2025云栖大会期间,阿里云智能集团首席技术官、通义实验室负责人周靖人透露,连续发布数十款模型背后有战略考量:全球AI模型进展都在加速,整个通义家族一直在跟全球AI领域的领先者进行你追我赶,AI今天已进入加速期,比拼的是模型迭代效率;同时模型从单模态到多模态的演进是必然趋势,阿里期待接下来在多模态方面还有进一步的创新和突破。

许主洪或是目前阿里最适合牵头做这件事情的人。他曾在在今年5月蚂蚁技术开放日上的演讲中提到,当下,用统一的框架做理解和生成,发展多模态大模型的一大演进趋势。但这一领域发展尚处于的初级阶段,需要实践验证。 

▲许主洪在讲解统一多模态模型产业发展脉络

许主洪指出,统一理解与生成的多模态大模型面临众多技术挑战在全模态交互挑战方面,当下支持音、视、图、文全模态交互的公开单模型非常少见;在理解与生成统一方面,图像和语意的理解生成统一模型鲜有出现,且理解和生成效果难以平衡。 

而在6月的演讲中,许主洪也提到:“多模态Agent AI时代才刚刚开始,未来要真正达到AGI,我们还需要解决很多技术难题,包括多模态大模型的基础能力、Agent智能体的核心功能模块、数据世界的连接与操作、物理世界的交互与控制等等,都有很多的挑战,但是这也是未来多模态大模型行业的机会。” 

截至目前,阿里及许主洪方未对此进行置评。 

本文来自微信公众号 “智东西”(ID:zhidxcom),作者:李水青,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

许主洪 阿里通义 大模型 多模态 AI科学家 Steven Hoi Alibaba Tongyi Large Models Multimodal AI Scientist
相关文章