热点
关于我们
xx
xx
"
大模型训练
" 相关文章
蚂蚁数科推出多语种视觉大模型训练框架
oschina.net
2025-11-04T08:56:43.000000Z
让AI学习效率飙升50倍的秘密:在线策略蒸馏
硅星GenAI
2025-10-28T13:33:42.000000Z
不改超参、不调token:用分位数替代均值,QAE让大模型强化学习更稳定
PaperWeekly
2025-10-21T14:54:07.000000Z
不改超参、不调token:用分位数替代均值,QAE让大模型强化学习更稳定
PaperWeekly
2025-10-21T14:00:29.000000Z
NeurIPS 2025 | 上交大提出MM-UPT:多模态大模型的“无监督后训练”范式
PaperWeekly
2025-10-19T08:34:28.000000Z
小米 AI 新论文,雷军千万年薪要挖的 DeepSeek“天才少女”罗福莉署名
IT之家
2025-10-16T04:50:13.000000Z
今晚直播丨AIOps在大模型训练场景的实践
dbaplus社群
2025-10-13T00:53:16.000000Z
[分享发现] [兑换码分发] 开箱即用、全链路功能覆盖的低代码在线大模型训练与微调服务平台|共 20 个
V2EX
2025-10-11T08:03:20.000000Z
直播预告丨AIOps在大模型训练场景的实践
dbaplus社群
2025-10-09T00:48:57.000000Z
直播预告丨AIOps在大模型训练场景的实践
dbaplus社群
2025-10-09T00:48:57.000000Z
Distributed Low-Communication Training with Decoupled Momentum Optimization
cs.AI updates on arXiv.org
2025-10-07T04:14:37.000000Z
估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
新智元
2025-09-27T11:30:57.000000Z
AI 云服务之争:CoreWeave 向上,Nebius 向下
OneFlow
2025-09-25T10:01:42.000000Z
大模型训练新突破!Meta提出LSP:无数据也能实现能力飞升
新智元
2025-09-20T11:35:56.000000Z
大模型训练新突破!Meta提出LSP:无数据也能实现能力飞升
新智元
2025-09-20T10:33:17.000000Z
三种视角下的Symmetric Memory,下一代HPC内存模型
掘金 人工智能
2025-09-18T17:28:30.000000Z
中文互联网基础语料 3.0 发布,数据量高达120GB
oschina.net
2025-09-18T10:00:09.000000Z
支持百万卡扩展,中科曙光发布国内首个开放架构 AI 超集群系统
IT之家
2025-09-05T13:19:56.000000Z
大模型“记性差一点”反而更聪明,金鱼损失随机剔除token,让AI不再死记硬背
36kr
2025-09-03T23:55:54.000000Z
Reinforcement Learning with NVIDIA NeMo-RL: Megatron-Core Support for Optimized Training Throughput
Nvidia Developer
2025-09-03T15:10:35.000000Z