在今年的小米5月发布会上,O1 芯片成为全场焦点。作为一颗自研处理器,它被赋予了“国产突破”的意味。但有一个细节没有被过多强调:O1 的底层依然基于 Arm 架构。
这其实并不稀奇。无论是苹果的 M 系列、华为的麒麟,还是联发科和三星的旗舰芯片,几乎都离不开 Arm。厂商们可以在影像算法、AI 体验、硬件调校上争奇斗艳,但架构层面的支撑,始终由 Arm 提供。
90 年代,它率先提出处理器授权模式,把设计与制造分开;2007 年,第一代 iPhone 的 A 系列芯片采用 Arm 架构,自此开启了智能手机的黄金时代。二十多年过去,Arm 的设计已经出现在全球数百亿台设备中,却极少被普通用户直接感知。
但生成式 AI 的崛起打破了这种平衡,底层技术的价值日益凸显,成为各个厂商竞争的关键,Arm凭借其能效优势,正迎来在终端侧驱动AI浪潮的历史性机遇。
在这样的背景下,Arm 推出了 Lumex CSS 平台。这一次,它不再只是提供架构蓝图,而是把 CPU、GPU、系统 IP 与开发工具链整合成一个完整的计算子系统,直接交付给整个产业链。
Arm 正在尝试从幕后走向台前。
1
一、Arm Lumex CSS 平台是什么
在 Arm 的官方定义里,CSS 是一种面向特定市场的“打包平台”。过去,Arm 主要提供的是 CPU 和 GPU 的 IP 授权,芯片厂商需要自己去整合系统互连、内存管理、物理设计和软件工具。这种模式虽然灵活,但成本高、周期长。
Lumex CSS 的出现,改变了这种关系。它不仅提供最新的 Arm C1 CPU 与 Arm Mali G1-Ultra GPU,还包含高效的系统互连、内存管理单元、物理设计方案,甚至连开发工具链都一起打包交付。对芯片厂商来说,这更像是一份“高效蓝图”:拿来即可基于 3nm 等先进工艺快速实现量产。
此外,Arm 不再把 AI 看作“附加功能”,而是把它写进了平台的底层逻辑。无论是旗舰手机、轻薄笔记本,还是中端设备,都能通过 Lumex 获得一个开箱即用的 AI 体验。
用装修房子来做比喻的话,过去的 Arm 只提供设计草图,厂商需要自己找施工队和材料;而 Lumex CSS 连水电布线和装修方案都准备好了,厂商只需要在此基础上做个性化定制。
1
二、CPU:C1 CPU集群 + SME2 的突破
在移动计算的二十年里,CPU 一直像是幕后调度员。它负责分配任务、维持秩序,却把最核心的 AI 推理交给 GPU 或 NPU,用户几乎不会把智能直接与 CPU 联系在一起。而 C1 CPU 集群的出现,正在改写这种设定。基于 Armv9.3 架构,它首次引入了 SME2 指令集扩展,让 CPU 本身变成一个可以直接承担推理的“隐形加速器”。
SME2 简单来说就是 Arm 引入的一套指令扩展。它的核心作用是让 CPU 能够像 GPU 或 NPU 一样高效处理大规模的矩阵运算,这类运算正是 AI 推理和深度学习的基础。在 CPU 方面,启用 SME2 技术的 Armv9.3 C1 CPU 集群结合了 Arm KleidiAI 对主流框架和运行时库的原生支持,在包括典型机器学习推理、语音及生成式 AI 等在内的广泛 AI 工作负载中,相较于上一代 CPU 集群,在相同条件下实现了显著的速度提升。
从技术层面来看,Lumex 通过 C1 CPU + SME2 和 Mali G1-Ultra GPU,把 AI 能力写入设备的底层逻辑;从生态层面,它通过 KleidiAI 工具链,把开发者和应用无缝绑定进来。Arm 把这些元素打包成一份完整方案,降低了合作伙伴的门槛,让整个产业链能以更快速度响应 AI 浪潮。