热点
"DrafterBench" 相关文章
大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力
新智元 2025-07-18T05:07:17.000000Z
大模型转行土木工程,首个「打灰人」评估基准:检验读、改工程图纸能力
36kr-科技 2025-07-18T04:22:43.000000Z
大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力
新智元 2025-07-18T02:37:22.000000Z
DrafterBench: Benchmarking Large Language Models for Tasks Automation in Civil Engineering
cs.AI updates on arXiv.org 2025-07-16T04:28:40.000000Z