机器之心 09月21日
谷歌AI大牛转投马斯克xAI,助力Grok 4 Fast模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌DeepMind的资深研究科学家Dustin Tran,也是Gemini模型的关键贡献者,已正式加入埃隆·马斯克的xAI。Tran在谷歌工作近九年,参与了Gemini系列模型从早期研发到评测发布的多个重要环节,并在强化学习、评测等领域贡献卓著。他表示,xAI在算力、数据以及团队执行力方面展现出巨大潜力。此次跳槽,他将助力xAI开发先进的大语言模型,并已参与了新发布的Grok 4 Fast模型的研发。该模型在保持强大推理能力的同时,显著降低了成本和运行速度,并在LMArena等榜单上表现优异,甚至超越了Gemini 2.5 Flash。

🌟 人才流动加剧AI领域竞争:谷歌DeepMind的资深研究科学家Dustin Tran已转投埃隆·马斯克的xAI,显示出AI领域高级人才争夺的激烈态势。Tran曾是谷歌Gemini模型系列的核心贡献者,其加入xAI预示着xAI将在大语言模型研发上获得强大助力。

🚀 Gemini模型关键人物转投:Dustin Tran在谷歌DeepMind近九年的工作经历中,深度参与了Gemini-0801、Gemini 2.5等模型的研发、评测与发布,并在强化学习、评测与数据等基础环节贡献突出。他的离开标志着谷歌在AI研发领域的一项重要人才流失。

💡 xAI的吸引力与优势:Tran选择加入xAI,是基于其在算力、数据以及团队执行力方面的显著优势。他提到xAI拥有前所未有的计算资源,并对Grok 4在强化学习和后训练的规模化上进行了巨大投入,同时强调了xAI团队的快速行动能力。

🖼️ Grok 4 Fast模型发布与性能:Tran加入xAI后,参与了Grok 4 Fast模型的发布。该模型作为Grok 4的优化版本,在保持强大的推理能力(如在AIME等核心评测中与Grok 4相当)的同时,显著降低了运行成本(降低15倍)并提升了效率,在LMArena榜单上取得了优异成绩(排名第8),展现了xAI在模型优化方面的实力。

2025-09-21 13:24 北京

从Gemini到Grok

机器之心报道

机器之心编辑部

大厂之间不是「你挖我」,就是「我挖你」。

那边特斯拉 Optimus AI 团队负责人 Ashish Kumar 被挖去 Meta,这边谷歌 DeepMind 资深研究科学家被 xAI 挖走了。

马斯克发推祝贺,并用火箭符号喊话:「起飞啦」!

此次,被挖去 xAI 的是一名在谷歌 DeepMind 工作近 9 年的大神级人物 ——Dustin Tran,离职前担任资深首席研究员。

他是谷歌 Gemini-0801 的共同创造者,这是谷歌首个在 LMSYS 上登顶的模型。同时是 Gemini 2.5 系列模型的评测专家,这些模型在 WebDev Arena 和 HLE 等榜单上取得了第一名。他还是谷歌 Gemini 1、1.5、2 和 2.5 的核心贡献者之一,其工作涵盖了强化学习、评测与数据等基础环节,并共同主导了相关论文与成果发布。

他在 X 上发表了一篇公开离职信,全文如下:

我在谷歌 DeepMind 工作 8 年多后选择了离开。这里留下了许多美好的回忆,最初在 Google Brain 参与早期奠基性的论文,与 Noam Shazeer、Ashish Vaswani、Lukasz Kaiser 合作完成 Image Transformer、Tensor2Tensor、Mesh TensorFlow。

后来主导 Gemini 的后训练评测,在 100 天内完成追赶并成功发布,带领团队登上 LMArena 榜首,并保持了一年多;最后参与 Gemini 在推理方面的突破性创新,与 Heng-Tze Cheng、Quoc Le 合作在 IMO 与 ICPC 中夺得金牌。

Gemini 的旅程是一场从一个范式到另一个范式的狂野转变。一开始,我们重塑了 LaMDA 模型(第一个类指令的聊天机器人),从一个简单的对话机器人进化到能够通过 RLHF 生成长篇、有内容的回答;接着,通过在长链思维、全新环境和奖励头上的训练,推动推理与深度思考的能力。刚开始时,外界的舆论非常糟糕,几乎所有人都觉得谷歌会因为搜索的历史包袱和组织政治而注定失败。

如今,Gemini 在用户偏好上稳定占据第一,并引领新的科学突破。大家又觉得谷歌获胜是理所当然的。过去 OpenAI 还常常靠着在我们发布之前,从他们的想法储备中抢先宣布消息来抢占 AI 舆论周期。但现在可以说,那些储备已经见底了。

现在,我已经加入了 xAI。原因众所周知:算力、数据以及大约一百位聪明且勤奋的人,就足以训练出前沿级的大语言模型。xAI 对此深信不疑。

算力方面,即便在谷歌,我也从未见过人均拥有如此数量的芯片。随着 Colossus 2 的上线,xAI 还将迎来超过 10 万块 GB200 与 30 万块芯片的投入使用。数据方面,Grok 4 在强化学习和后训练的规模化上做出了最大押注。xAI 还在数据扩展、深度思考与训练范式方面进行新的尝试。

整个团队行动极其迅速,没有任何一家公司能够在如此短的时间内达到 xAI 今天在 AI 能力上的水平。正如马斯克所说,「一家公司创新速度的一阶与二阶导数最为重要:xAI 的加速度是最高的。」

我很高兴地宣布,在加入 xAI 的前几周,我们就发布了 Grok 4 Fast。Grok 4 是一款出色的推理模型,依然在 ARC-AGI 和 FinSearchComp 等新基准上保持领先。不过,它运行较慢,而且从未真正面向通用用户需求。Grok 4 Fast 则是最优秀的小型模型之一,在 LMArena 上排名第 8(而 Gemini 2.5 Flash 仅排第 18)。在 AIME 等核心推理评测中,它的表现与 Grok 4 相当,但成本却降低了 15 倍。

根据 Dustin Tran 的领英资料,他本科毕业于加州大学伯克利分校,此后原本在哈佛大学读统计学博士,但之后转到了哥伦比亚大学读计算机科学博士。

他在 2017 年加入谷歌,直到最近离职加入 xAI。

参考链接:https://x.com/dustinvtran/status/1969183617881686405

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

xAI Dustin Tran Gemini Grok 4 Fast AI人才 大语言模型
相关文章