Datawhale 与 AMD 联合启动“AMD 2025 分布式推理算子优化挑战赛”,聚焦多 GPU 分布式推理算子开发与优化,旨在 AMD GPU 上实现 LLM 推理性能突破。赛事设高额奖金池,特等奖 100,000 美元。挑战内容包含单节点 8GPU 全互连、GEMM + Reducescatter、Allgather + GEMM 三类算子优化。比赛提供参考实现、性能理论上限、输入配置及自动化评测平台。报名及提交时间分别为 8 月 24 日至 9 月 21 日,以及 8 月 31 日至 10 月 14 日。个人或三人组队参赛,需年满 18 岁并拥有 GitHub 和 Discord ID。
🚀 **赛事重磅回归,目标 LLM 推理性能突破:** Datawhale 与 AMD 联合举办的“AMD 2025 分布式推理算子优化挑战赛”再次启动,本次赛事将重点关注多 GPU 分布式推理算子的开发与优化,旨在推动 LLM 在 AMD GPU 上的推理性能达到新的高度。
💰 **丰厚奖金激励,最高 10 万美元等你赢取:** 赛事为优胜者准备了极具吸引力的奖金池,特等奖高达 100,000 美元,并有其他名次奖项,部分优胜者更有机会受邀参加在旧金山举行的 AMD DevDay 及颁奖典礼,与全球顶尖开发者交流。
🧠 **聚焦核心技术挑战,多维度提升算子性能:** 本次挑战赛围绕单节点 8GPU 的三种关键分布式推理场景展开:全互连算子(All-to-All)考验通信与计算融合调度;GEMM + Reducescatter 挑战跨 GPU 矩阵乘与通信融合;Allgather + GEMM 则侧重聚合与计算的并行优化,旨在全面提升算子效率。
📊 **完善的评测体系,助力公平竞技:** 比赛提供了参考实现(baseline)、性能理论上限(roofline)、输入 shape 与配置,以及自动化的评测平台(KernelBot),确保了比赛的公平性和效率,让开发者能专注于算法和代码优化。
2025-09-08 22:01 浙江

还记得今年春季的 “智算极速争锋 AMD 2025推理优化挑战赛“ 吗?在社区的大力推广下,我们集结了数百位开发者,在 AMD GPU 上展开算子性能的极限拉扯,排行榜刷新到最后一刻,开发者及社区热度持续飙升,涌现出一批在开源实现上突破极限的高手!金秋时节,我们再次开启 AMD 2025 分布式推理算子优化挑战赛!本次赛事聚焦多GPU分布式推理算子的开发与优化,目标是在 AMD GPU 上实现 LLM 推理性能的突破。💰 你没有看错,高额奖金池等你来战!
🥇 特等奖:100,000美元
🥈 第一名:25,000美元
🥉 第二名:15,000美元
🏅 第三名:10,000美元
部分优胜者将受邀前往旧金山,参加 AMD DevDay 及颁奖典礼,与全球顶尖开发者面对面交流!🧠 技术挑战亮点 本次挑战赛将围绕三类分布式推理算子展开:1. 单节点8GPU全互连算子(All-to-All):考验通信与计算融合的极限调度能力2.单节点8GPU GEMM + Reducescatter:挑战跨GPU矩阵乘与通信融合的性能瓶颈3.单节点8GPU Allgather + GEMM:聚合与计算并行优化,适配大模型推理场景📊 每类题目将提供
参考实现(baseline)
性能理论上限(roofline)
输入 shape 与配置
自动化评测平台(KernelBot)
📅 时间节点(北京时间)
报名时间:2025年8月24日上午3:00-9月21日下午14:59
提交时间:2025年8月31日上午3:00-10月14日下午14:59
🛠️ 参赛方式
🤝 社区合作
本次挑战赛由 AMD 联合魔搭社区 与Datawhale 共同举办,依托中国开发者生态,提供技术支持、资源分享与社区交流。欢迎所有对 GPU 性能优化、分布式推理、开源算子挑战感兴趣的开发者参与!
📬 立即报名
扫码报名大赛🙌 进群交流
只要对大赛感兴趣,就能进群。