2025-09-08 22:01 浙江
Datawhale大赛
赛事:AMD 2025 分布式推理算子优化挑战赛
Datawhale大赛
赛事:AMD 2025 分布式推理算子优化挑战赛

🚀 **赛事重磅回归,优化推理算子性能**:AMD 2025 分布式推理算子优化挑战赛再次启动,本次大赛以 AMD GPU 为平台,重点在于开发和优化多 GPU 分布式推理算子,以期在大型语言模型(LLM)的推理性能上实现显著提升。
💰 **巨额奖金与国际交流机会**:赛事提供了高达 100,000 美元的总奖金池,包含特等奖 100,000 美元、第一名 25,000 美元、第二名 15,000 美元以及第三名 10,000 美元。部分优胜者将有机会受邀前往旧金山,参与 AMD DevDay 及颁奖典礼,与全球顶尖开发者进行面对面交流,拓展国际视野。
🛠️ **聚焦三大技术挑战,提供完善评测环境**:本次挑战赛将重点攻克三类关键的分布式推理算子:单节点 8GPU 的全互连算子(All-to-All)、GEMM + Reducescatter 算子以及 Allgather + GEMM 算子。为了确保公平公正,大赛提供了参考实现(baseline)、性能理论上限(roofline)、输入 shape 与配置,以及一个自动化的评测平台(KernelBot),让开发者能够专注于算子本身的优化。
📅 **清晰的时间规划与便捷的参赛方式**:大赛报名时间为 2025 年 8 月 24 日至 9 月 21 日,提交截止日期为 10 月 14 日。参赛者可选择个人参赛或组建最多三人团队。所有参赛者需年满 18 岁,并拥有有效的 GitHub ID 和 Discord ID。中国大陆的参赛者还可以通过指定的 GitHub CLI 工具或 Discord KernelBot 提交算子,实现自动化运行和结果上传。
🤝 **社区联动,共促开发者生态**:本次挑战赛由 AMD 联合魔搭社区与 Datawhale 共同举办,旨在依托中国开发者生态,为参与者提供强大的技术支持、丰富的资源分享以及活跃的社区交流平台,共同推动 GPU 性能优化和开源算子技术的发展。
2025-09-08 22:01 浙江
Datawhale大赛
赛事:AMD 2025 分布式推理算子优化挑战赛
还记得今年春季的 “智算极速争锋 AMD 2025推理优化挑战赛“ 吗?在社区的大力推广下,我们集结了数百位开发者,在 AMD GPU 上展开算子性能的极限拉扯,排行榜刷新到最后一刻,开发者及社区热度持续飙升,涌现出一批在开源实现上突破极限的高手!
金秋时节,我们再次开启 AMD 2025 分布式推理算子优化挑战赛!本次赛事聚焦多GPU分布式推理算子的开发与优化,目标是在 AMD GPU 上实现 LLM 推理性能的突破。
💰 你没有看错,高额奖金池等你来战!
🥇 特等奖:100,000美元
🥈 第一名:25,000美元
🥉 第二名:15,000美元
🏅 第三名:10,000美元
部分优胜者将受邀前往旧金山,参加 AMD DevDay 及颁奖典礼,与全球顶尖开发者面对面交流!
🧠 技术挑战亮点 本次挑战赛将围绕三类分布式推理算子展开:
1. 单节点8GPU全互连算子(All-to-All):考验通信与计算融合的极限调度能力
2.单节点8GPU GEMM + Reducescatter:挑战跨GPU矩阵乘与通信融合的性能瓶颈
3.单节点8GPU Allgather + GEMM:聚合与计算并行优化,适配大模型推理场景
📊 每类题目将提供
参考实现(baseline)
性能理论上限(roofline)
输入 shape 与配置
自动化评测平台(KernelBot)
📅 时间节点(北京时间)
报名时间:2025年8月24日上午3:00-9月21日下午14:59
提交时间:2025年8月31日上午3:00-10月14日下午14:59
🛠️ 参赛方式
个人或最多三人组队
年满18岁,拥有有效 GitHub ID 和 Discord ID
中国大陆参赛者可通过指定GitHub CLI 工具或Discord KernelBot提交算子,自动运行并上传结果
🤝 社区合作
本次挑战赛由 AMD 联合魔搭社区 与Datawhale 共同举办,依托中国开发者生态,提供技术支持、资源分享与社区交流。欢迎所有对 GPU 性能优化、分布式推理、开源算子挑战感兴趣的开发者参与!
📬 立即报名
扫码报名大赛
🙌 进群交流
只要对大赛感兴趣,就能进群。
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑