36kr-科技 02月18日
刚刚,马斯克发布 Grok3,推理能力远超 o3 mini(high) 和 DeepSeek-R1
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

马斯克发布了号称“地球最聪明的AI”——Grok3,该模型由包含约20万个GPU的数据中心训练,计算能力是上一代Grok 2的十倍,并使用了扩大的训练数据集。Grok3在AIME'24、GPQA等测试中均取得了比Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果,尤其在推理方面表现突出。Grok app上线了基于Grok3推理模型的DeepSearch功能,具备研究、头脑风暴和数据分析等选项。未来Grok应用程序还将具备“语音模式”,xAI计划开源上一代模型Grok 2。

🧠Grok3的强大算力:Grok3由包含约20万个GPU的数据中心训练,计算能力是上一代模型Grok 2的十倍,并使用了扩大的训练数据集。

🏆Grok3的卓越性能:Grok3在AIME'24、GPQA等测试中均取得了比Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果,尤其在推理方面表现突出,最高分达到96分。

🔍DeepSearch功能上线:基于Grok3推理模型,Grok app上线了DeepSearch功能,可以表达其理解查询的过程以及计划响应的方式,会扫描互联网和X,分析信息,并针对问题提供摘要,包含研究、头脑风暴和数据分析等选项。

🎤Grok应用程序将具备“语音模式”:马斯克透露,未来Grok应用程序将具备“语音模式”,这将为Grok模型提供合成语音。几个月后,xAI 将开源上一代模型 Grok 2。

在试图以 974 亿美元收购 OpenAI 的提议被拒绝后,世界首富马斯克又搞了一个大动作——

刚刚,他发布了号称“地球最聪明的 AI”,Grok3,其由一个包含约 20 万个 GPU 的数据中心训练,计算能力是上一代模型 Grok 2 的“10 倍”,且使用了扩大的训练数据集。

据此前介绍,Grok 3 是在合成数据的基础上进行训练的,它能够通过重读数据来反思所犯的错误,从而达到逻辑上的一致性。

评测结果方面,Grok3 在 AIME'24(美国数学竞赛)、GPQA(研究生水平科学知识问答能力的基准测试)等测试中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。

尤其在推理方面,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等测试中取得了压倒性的优势,最高分达到 96 分,超过了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。

甚至,在最新的 AIME 2025 评测中,Grok3 推理系列模型更是达到了 90 及以上的分数,稍微领先 o3 mini(high) 的 87 分。

基于 Grok3 推理模型,Grok app 上线了 DeepSearch 功能,DeepSearch 可以表达其理解查询的过程以及计划响应的方式,会扫描互联网和 X,分析信息,并针对问题提供摘要。据现场演示 ,DeepSearch 包括研究、头脑风暴和数据分析等选项。

此外,在 Chatbot Arena 评估中,Grok-3 的得分达到了 1400 分,同样超过了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。

此外,马斯克在直播中透露,未来——最快一周后——Grok 应用程序将具备“语音模式”,这将为 Grok 模型提供合成语音。几个月后,xAI 将开源上一代模型 Grok 2。“我们的一般做法是,当下一个版本完全推出时,我们将开源上一个版本(Grok)。”

马斯克曾多次警告说,人工智能会给人类文明带来风险,但他仍在极力推动加大对这一领域的投资。

xAI 于 12 月表示,它在新一轮融资中筹集了 60 亿美元,投资者包括美国风险资本家、芯片制造商英伟达和 AMD,以及沙特阿拉伯和卡塔尔的投资基金等。去年 5 月,该公司首次融资便获得了高达 60 亿美元的资金。

本文来自微信公众号“学术头条”(ID:SciTouTiao),作者:学术头条,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Grok3 马斯克 人工智能 AI模型 DeepSearch
相关文章