36kr-科技 05月08日
1/8成本比肩Claude 3.7,Mistral Medium 3来了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Mistral AI推出了最新的多模态模型Mistral Medium 3,这款模型在编程和多模态理解方面表现出色,并在性能和成本之间取得了平衡。官方宣称,Mistral Medium 3的性能可以达到或超越Claude 3.7 Sonnet的90%,但成本却大大降低。该模型已在多个平台上推出API,并具备企业级能力,包括混合部署、定制化后期训练以及与企业工具和系统集成等。Mistral AI还推出了Le Chat Enterprise聊天机器人服务,进一步拓展了其企业级应用。

💻Mistral Medium 3在编程和STEM任务中表现出色,性能接近甚至超越了许多大型竞争对手,并在多模态和其他人语言任务中优于Llama 4 Maverick。

💰该模型在成本方面具有显著优势,每百万输入token仅需0.4美元,每百万输出token仅需2美元,远低于Claude 3.7 Sonnet的价格。

🚀Mistral Medium 3已在Mistral La Plateforme和Amazon Sagemaker上线,并将在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex等平台上推出API,方便企业用户使用。

⚙️Mistral AI强调了该模型的企业级能力,包括混合部署、定制化后期训练以及与企业工具和系统集成,方便企业将智能全面集成到系统中。

💬Mistral AI还推出了Le Chat Enterprise,一项面向企业的聊天机器人服务,提供AI Agent建造器等工具,并与Gmail、Google Drive、SharePoint等第三方服务集成。

用1/8成本比肩Claude 3.7,刚刚,“欧洲OpenAI”Mistral AI发布多模态新模型。

Mistral Medium 3,主打编程和多模态理解,且在性能和成本间进行了平衡。

官方称,在各类基准测试中,Mistral Medium 3性能达到或超越Claude Sonnet 3.7的90%,且成本大大降低。

Claude 3.7 Sonnet的价格为每百万输入token 3美元,每百万输出token 15美元,而Mistral Medium 3:

每百万输入token仅0.4美元,每百万输出token 2美元

整体性能,不管是和领先开源模型Llama 4 Maverick还是和企业级模型Cohere Command A相比,Mistral Medium 3都能打得有来有回。

目前,Mistral Medium 3 API已在Mistral La Plateforme和Amazon Sagemaker上线,不久后还将在IBM WatsonX、NVIDIA NIM、Azure AI Foundry和Google Cloud Vertex上推出。

具备一系列企业级能力

下面具体来看看基准测试。

Mistral Medium 3在编程和STEM任务中尤为突出。

官方原话是“其性能甚至接近非常大且运行速度慢得多的竞争对手”。

不过呢,既不开放模型权重,也没有透露模型大小……

另外,Mistral AI还发布了第三方人类评估。

人类评估中,Mistral Medium 3依旧是在编程方面占优势。

在多模态和其他人语言任务中,相比Llama 4 Maverick,Mistral Medium 3的表现也占上风。

除了测试数据之外,官方还特别强调了其适应企业环境的能力,包括:

企业可以轻松将智能全面集成到系统中,借助Mistral的应用AI解决方案,该模型可以持续进行预训练、全面微调,并融入企业知识库,使其成为针对特定领域训练、持续学习和自适应工作流程的高保真解决方案。

官方称,金融服务、能源和医疗保健领域的客户正在使用该模型测试,通过深入的背景信息来丰富客户服务、实现业务流程的个性化,并对复杂的数据集进行分析。

另外,他们还推出了Le Chat Enterprise,这是一项面向企业的聊天机器人服务,提供了AI Agent建造器之类的工具,并将Mistral的模型与Gmail、Google Drive、SharePoint等第三方服务集成。

据了解,Le Chat Enterprise将很快支持 MCP。

Mistral Medium 3发布后引发大批网友关注,有网友为其“高性价比”点赞。

不过也有不少网友吐槽模型没说开源结果又高调地和开源模型比较,有点奇怪。

还有行动派网友,想看什么自己比较。

StabilityAI创始人翻出了Gemini 2.5 Flash的基准测试结果:

看后表示:

与Gemini 2.5 Flash竞争是多么困难,Gemini 2.5 Flash成本比Mistral Medium 3低70%。

期待开源模型的发布,这是Mistral的关键优势。

One More Thing

继三月份推出Mistral Small、今日推出Mistral Medium后,Mistral AI透露接下来几周正着手开发“大型”项目。

参考链接

[1]https://mistral.ai/news/mistral-medium-3

[2]https://x.com/MistralAI/status/1920119463430500541

[3]https://techcrunch.com/2025/05/07/mistral-claims-its-newest-ai-model-delivers-leading-performance-for-the-price/

本文来自微信公众号“量子位”,作者:西风,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Mistral AI 多模态模型 Claude 3.7 人工智能 成本
相关文章