热点
"MXFP4" 相关文章
How Quantization Aware Training Enables Low-Precision Accuracy Recovery
Nvidia Developer 2025-09-21T15:21:54.000000Z
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
智源社区 2025-08-19T05:00:11.000000Z
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
智源社区 2025-08-12T10:05:42.000000Z
推理成本骤降75%。gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
36氪 - 科技频道 2025-08-11T10:13:00.000000Z
Oscillation-Reduced MXFP4 Training for Vision Transformers
cs.AI updates on arXiv.org 2025-07-10T04:06:09.000000Z