热点
"执行能力" 相关文章
剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了
新智元 2025-10-14T09:13:01.000000Z
剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了
新智元 2025-10-14T09:13:01.000000Z
剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了
新智元 2025-10-13T16:36:30.000000Z
剑桥揭开大模型翻车黑箱!别再怪它不懂推理,是行动出错了
新智元 2025-10-13T16:36:30.000000Z
剑桥揭开大模型翻车黑箱,别再怪它不懂推理,是行动出错了
36kr-科技 2025-10-13T10:58:33.000000Z
先验+后验加持,大模型能否 hold 住推理预测的现实「溢出」?
机器之心 2025-09-27T07:10:29.000000Z
详细内容:https://t.co/ln1wctGy2h
小互推特 2025-09-26T01:17:04.000000Z
Thinking, Searching, and Acting
Interconnects 2025-09-25T10:01:35.000000Z
The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs
少点错误 2025-09-13T13:16:08.000000Z
文心X1.1实测:这个“会思考”的AI到底有多聪明?
硅星人Pro 2025-09-11T16:05:10.000000Z
破解人机协作密码:工作技能拆成两层,AI执行人类决策成功率狂飙
36kr 2025-08-28T03:46:47.000000Z
Code Simulation as a Proxy for High-order Tasks in Large Language Models
cs.AI updates on arXiv.org 2025-07-08T06:58:40.000000Z
让 AI 从「语言智能」进化到「现实智能」,这家手机公司想得最透彻
极客公园 2024-10-29T00:26:50.000000Z