量子位 02月01日
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里通义发布Qwen2.5-Max,在多项基准测试中超越DeepSeek V3等模型,包括Arena-Hard、LiveBench等。Qwen2.5-Max不仅在整体表现上优于DeepSeek V3、Llama-3.1-405B等,在基座模型对比中也同样领先。该模型是超大规模MoE模型,经过大量预训练数据和精心设计的训练方案训练而成。此外,Qwen2.5-Max还展示了强大的多模态能力,包括联网搜索、代码生成和Artifacts功能,例如,能快速生成可视化内容、小游戏等。目前已在Qwen Chat上线,并可通过Hugging Face、Any Chat等平台使用。

🚀Qwen2.5-Max在多项基准测试中表现卓越,超越DeepSeek V3等当红模型,展现出强大的性能和竞争力。

💡该模型采用超大规模MoE架构,经过20万亿token的预训练和精细的SFT+RLHF训练,确保了其在知识理解和推理能力上的领先地位。

💻Qwen2.5-Max具备强大的多模态能力,包括联网搜索、代码生成和Artifacts功能,能够快速生成可视化内容、小游戏等,应用场景广泛。

🌐目前,Qwen2.5-Max已在Qwen Chat上线,并可通过Hugging Face、Any Chat等平台使用,方便用户体验和应用。

关注前沿科技 2025-01-29 11:25 北京

网友:新年快乐,特别是奥特曼

西风 梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

昨晚,杭州大模型又双叒不睡,给大伙儿 拜 年 啦~

就在春晚直播进行时,里通义Qwen发布新春节礼第三弹

Qwen2.5-Max来袭,多个基准测试中超越当红炸子鸡DeepSeek V3。

Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准统统拿下,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,和Claude-3.5-Sonnet也能比一比。

基座模型对比中,Qwen2.5-Max同样超越DeepSeek V3、Llama-3.1-405B,在针对模型知识理解和推理能力的MMLU-Pro等基准上均表现不凡。

更令AI社区关注的是,Qwen2.5-Max同DeepSeek V3一样是超大规模的MoE模型,经超20万亿token的预训练数据及精心设计SFT+RLHF后训练方案训练而成。

Qwen2.5-Max这份春节礼包被网友们齐刷刷收入囊中。前有DeepSeek,还有阿里通义Qwen,网友们不忘艾特奥特曼:

祝大家新年快乐,特别祝Sam。

阿里研究员在模型发布后也都还不睡,纷纷当起了自个儿的自来水。

阿里高级算法专家林俊旸开麦:

Qwen2.5-Max在基准测试中表现良好,希望大家可以试试看,新年快乐!

之前曾自曝阿里大模型员工996作息表的Binyuan Hui也再次现身:

外面的烟花照亮了天空,我却坐在电脑跟前。

多模态能力展示

下面是Qwen2.5-Max在四个使用场景上的演示。

首先是联网搜索功能,输出的每句话来源出处都有标注,整体运行也很丝滑。

代码能力上,Qwen2.5-Max能够帮助用户完成各种可视化创作,一句话就能做出下面这样旋转的球体:

有网友改造了一下,让球体内部有三个弹跳的黄色小球。

结果只尝试了一次就成功了,而且三个小球始终在大球内部运动,能正确处理碰撞:

Qwen2.5-Max也有Artifacts功能,同样一句话,能开发各种小应用、小游戏。

比如制作一个扫雷小游戏,秒秒钟“啪”一下直接就能玩:

另外Qwen2.5-Max数单词中的特定字母数量也不在话下。

现在,Qwen2.5-Max已在Qwen Chat中上线。

此外也有Hugging Face的Demo可玩,还上线了Any Chat,并且可通过阿里云服务使用API。

感兴趣的童鞋赶紧试试吧~

参考链接:
[1]https://qwenlm.github.io/blog/qwen2.5-max/
[2]https://x.com/JustinLin610/status/1884263803451498794
[3]https://x.com/_akhaliq/status/1884278071093502253
[4]https://x.com/huybery/status/1884263539675934860

量子位智库年终发布三大年度报告

带你一起回顾2024年人工智能智能驾驶Robotaxi新趋势,预见2025年科技行业新机遇

2024年度AI十大趋势报告

Robotaxi2024年度格局报告

智能驾驶2024年度报告


一键关注 ? 点亮星标

科技前沿进展每日见


一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Qwen2.5-Max 大模型 人工智能 MoE模型
相关文章