
作者: 鲍雁辛,李嘉琪 摘要: 华为正通过从大模型设计到基础设施的软硬协同,探索构建其全栈AI竞争力的路径。华为AI发展策略已逐渐从追赶并对标业界SOTA模型,转向为更好地发挥自研昇腾硬件潜力而量身定做模型架构。这一双向协同进化路径,旨在解决AI模型规模化应用中的系统性问题,并构建一个由软硬件协同架构、算子与软件栈构成的全栈技术体系。 盘古大模型的演进,其核心是为解决大规模分布式系统中的效率难题。随着大语言模型从稠密架构全面转向混合专家(MoE)稀疏架构,业界普遍面临专家负载不均衡这一系统性瓶颈
