热点
关于我们
xx
xx
"
Reasoning Capability
" 相关文章
RL新思路,复旦用游戏增强VLM通用推理,性能匹敌几何数据
36氪 - 科技频道
2025-10-22T05:15:20.000000Z
RL新思路,复旦用游戏增强VLM通用推理,性能匹敌几何数据
36氪 - 科技频道
2025-10-22T05:15:20.000000Z
蚂蚁开源万亿参数大模型Ling-1T:多项能力全球领先
掘金 人工智能
2025-10-09T23:51:30.000000Z
Quagmires in SFT-RL Post-Training: When High SFT Scores Mislead and What to Use Instead
cs.AI updates on arXiv.org
2025-10-03T04:16:07.000000Z
4B逼近DeepSeek-R1!Bengio团队「递归聚合」刷新小模型上限
PaperWeekly
2025-09-29T15:48:06.000000Z
DeepSeek-R1论文登上Nature封面,通讯作者梁文锋
36kr-科技
2025-09-18T02:11:54.000000Z
【论文解读 | 直播预告】Mini-o3模型,赋能视觉搜索多样化推理与多轮交互能力
智源社区
2025-09-17T09:48:42.000000Z
耗资15000个A100 GPU日!港中文、阿里等发布600万规模T2I推理数据集与基准
我爱计算机视觉
2025-09-14T10:06:02.000000Z
直播预告 | 人大高瓴赵鑫教授:AI慢思考与大模型复杂推理
PaperWeekly
2025-08-27T13:52:25.000000Z