热点
关于我们
xx
xx
"
模型评测
" 相关文章
首届AI交易大赛落幕,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏6000刀
36氪 - 科技频道
2025-11-04T12:22:33.000000Z
大模型比拼:MiniMax M2 vs GLM 4.6 vs Claude Sonnet 4.5
阮一峰的网络日志
2025-11-04T00:39:57.000000Z
Seedream 4.0大战Nano Banana、GPT-4o?EdiVal-Agent 终结图像编辑评测
机器之心
2025-10-24T10:43:24.000000Z
R-HORIZON:长程推理时代来临,复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式
机器之心
2025-10-23T06:16:01.000000Z
从会画画到会思考:快手可灵提出T2I-CoReBench,最强模型也难逃推理瓶颈
PaperWeekly
2025-10-19T08:34:29.000000Z
Latest open models (#15): It’s Qwen's world and we get to live in it, on CAISI's report, & GPT-OSS update
Interconnects
2025-10-18T15:37:49.000000Z
大模型盲测竞技场到底是个啥?
数字生命卡兹克
2025-10-09T04:23:41.000000Z
节前最后一波实测,智谱最新模型GLM-4.6
Datawhale
2025-10-02T04:11:27.000000Z
榜一换人!OCRBench v2九月新榜:揭示多模态大模型文档智能真实水平
PaperWeekly
2025-09-30T15:51:38.000000Z
Testing Zonos TTS + Ubuntu + 4090
Sam Patterson's Blog
2025-09-30T11:07:23.000000Z
RWKV7-G1a 2.9B 推理模型开源发布,继续推进纯 RNN 模型的思考能力
oschina.net
2025-09-30T10:41:12.000000Z
华为模型交互专利公布
oschina.net
2025-09-23T10:10:03.000000Z
ScienceQA最新榜单出炉!多家公司新模型分数均提升|xbench 月报
红杉汇
2025-09-22T01:07:39.000000Z
AI生成图片,哪家强?
钛媒体:引领未来商业与生活新知
2025-08-29T08:47:36.000000Z
AI生成图片,哪家强?
36kr
2025-08-29T06:36:11.000000Z
全网都在吹的 Nano- banana 图像模型,全方面测评来了!
夕小瑶科技说
2025-08-28T11:59:40.000000Z
《GPT-5 家族 SQL 能力评测报告》发布
oschina.net
2025-08-21T02:22:09.000000Z
主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK
虎嗅
2025-08-17T04:11:32.000000Z
JADE 6.0 新鲜出炉!14款多模态大模型幻觉频发,长推理模型也集体翻车?
复旦白泽战队
2025-08-16T13:54:32.000000Z
告别视觉奇观:这套“五维评测模型”,专给LLM的编码能力“挤水分”
掘金 人工智能
2025-08-13T16:36:56.000000Z