Cnbeta 09月21日
Gemini核心开发者Dustin Tran加盟xAI,助力Grok新模型研发
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Gemini的核心开发者Dustin Tran已正式从Google DeepMind离职,并加盟埃隆·马斯克的xAI公司,参与研发新一代Grok模型,特别是Grok 4 Fast。Tran在Grok 4 Fast的开发中扮演了重要角色,并对xAI的海量算力、数据和高效团队表示赞赏,认为这是构建前沿大语言模型的关键。他回顾了在Google八年期间参与Gemini开发的经历,包括从早期奠基性工作到带领团队实现LMArena榜首的飞跃。他强调xAI在算力、数据扩展和训练方法上的投入,以及团队极快的行动速度,预示着Grok 5及未来模型在AGI和ASI领域的潜力。

🌟 Dustin Tran,Gemini模型的核心开发者,已正式加入埃隆·马斯克的xAI公司,专注于新一代Grok模型的研发。这一人才引进被视为xAI在AI领域竞争力的重要提升。

🚀 Tran在加入xAI的初期便参与了Grok 4 Fast的开发,并对xAI所拥有的海量算力(尤其是Colossus 2的规划)和数据资源表示高度认可,认为这是其选择加盟的关键因素。

💡 Tran回顾了在Google DeepMind八年的丰富经历,包括参与Gemini的早期研究、后训练评测、以及带领团队在LMArena等评测中取得的优异成绩,展现了他深厚的AI研发功底。

📈 xAI的快速发展势头和在数据扩展、深度思考及训练配方上的投入,让Tran对Grok 5乃至更远的AGI/ASI目标充满期待,特别是Grok 4 Fast在性能与成本上的显著优势。

🌍 加州对竞业条款的限制被提及,这为人才在公司间的自由流动提供了保障,也促进了硅谷的创新活力,使得像Tran这样的顶尖人才能够无障碍地投身于新的前沿项目。

Gemini核心开发者Dustin Tran昨天官宣从GoogleDeepMind跳槽到xAI,研发新一代Grok!马斯克也于第一时间转发推文,确认了这位新同事的加盟xAI消息属实:


从官宣中得知,Dustin Tran已经加入xAI至少几周了,参与了Grok 4 Fast的开发,但直到今天才修改自己的对外头衔介绍,甚至慢于马斯克转发推文。

这也被眼尖的网友发现并调侃了:


Dustin Tran的新同事,xAI创始成员,同时也是之前从GoogleDeepMind跳槽过来的Toby Pohlen,也于第一时间转发推文欢迎新同事:


也有网友关心竞业条款带来的限制:


加州禁止竞业条款,得以让人才能在公司间自由流动,这也被普遍认为是加州的创新活力源泉的重要保障。

Dustin Tran,Gemini核心开发者

Dustin Tran,是Gemini从诞生之初到最新模型的核心开发者。




2014年,他毕业于加州大学伯克利分校,取得数学与统计本科学位,随后进入哈佛大学攻读统计学博士学位,两年后又转入哥伦比亚大学攻读计算机科学博士,并于2018年取得了博士学位。


他目前的论文总引用量已超过2.4万。


他也在读博期间斩获了包括Google博士奖学金在内的多项大奖:


他的工作履历相当简洁:2017年在OpenAI研究岗实习,同一年进入Google大脑研究岗实习并留任长达8年。


在官宣离职的长推文中,他饱含深情地回顾了在Google的8年工作,从混沌中摸索出霸榜的Gemini的心路历程,以及因为xAI的海量算力而选择加入xAI:


我正式告别GoogleDeepMind,结束了8年的旅程。这一路有满满的美好回忆——从最早在Google大脑参与一些奠基性的论文(和 @noamshazeer、@ashvaswani、@lukaszkaiser 一起做 Image Transformer、Tensor2Tensor、Mesh TensorFlow),到后来负责Gemini的后训练评测,在100天内追赶并上线;接着带领团队实现跃升,拿下LMArena第一(并稳居榜首一年多!);最后还参与了Gemini在IMO和ICPC上斩获金牌的推理创新(和 @HengTze、@quocleix 一起)。

Gemini的旅程跌宕起伏,不断经历范式的转变:最初,我们改造了LaMDA模型(第一个类指令式的聊天机器人!),让它从单纯的聊天机器人进化为能通过RLHF给出更长、更有内容的回答;之后,我们探索通过长链条思维训练、新颖环境和奖励头来增强推理和深度思考能力。刚开始时,外界普遍并不看好,很多人觉得Google会因为搜索的历史包袱和内部政治而注定失败。但如今,Gemini不仅在用户偏好上长期稳居第一,还不断推动新的科学突破,大家反而觉得Google赢是理所当然的 。(以前每次Google有新成果时,OpenAI 总会靠积压的想法先一步发布,从而抢占 AI 的新闻周期;但可以说,他们的“库存”如今已经耗尽了。)

之后我加入了xAI。秘诀其实很清楚:算力、数据,以及大约 O(100) 个聪明又拼命努力的人,这就是拿下前沿级大语言模型所需的一切。xAI对此 真的 深信不疑。在算力方面,即使在Google,我也从没见过这种“人均芯片”的规模(而且Colossus 2上还有10 万+的GB200/30 万+的GB300即将到来)。在数据方面,Grok 4做出了RL和后训练规模化的最大押注。xAI现在则在数据扩展、深度思考和训练配方上下注。团队行动也极其迅速——在这么短的时间里,没有任何一家公司能在AI能力上达到 xAI 现在的水平。正如@elonmusk 所说,一家公司的一阶和二阶导数才是最关键的:xAI的发展势头是最快的。

我很兴奋地宣布,在加入的头几周,我们就推出了Grok 4 Fast。Grok 4是一个出色的推理模型,依然在ARC-AGI和新基准(如 FinSearchComp)上排名第一。但它运行较慢,本来也不是面向通用用户需求的。而Grok 4 Fast则是最好的轻量级模型之一——在LMArena上排名第 8(Gemini 2.5 Flash是第 18!),在核心推理评测(如 AIME)上,它能与Grok 4比肩,同时成本却低15倍。特别感谢 @LiTianleli、@jinyilll、@ag_i_2211、@s_tworkowski、@keirp1、@yuhu_ai_。

Gemini如今取得如此亮眼的成绩,也让我们对Dustin Tran能为Grok 5带来的惊喜多了一份期待。

Colossus 2的海量算力

召唤一个强大的Grok 5

我们在此前的文章中,也对马斯克在紧锣密鼓地建设中的Colossus 2进行了详细剖析:马斯克狂烧14万亿,5000万H100算力五年上线!终极爆冲数十亿


Colossus 2的海量算力,体现着马斯克毫不掩饰的野心:实现AGI乃至ASI,是Grok 5乃至xAI更后面的模型要追求的目标。

马斯克作为世界首富,要用天文数字般的算力,让所有对手望而却步。

最顶级的算力,吸引了最顶级的人才。

建设断档式强大AI的所有生产要素,马斯克一样也不想落下。

让我们拭目以待,Dustin Tran的加盟,能为我们带来多么强大的Grok 5。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Dustin Tran xAI Grok Gemini AI 大语言模型 Elon Musk Google DeepMind
相关文章