热点
"长文本" 相关文章
解析DeepSeek-OCR——怎么做到压缩10倍还不丢信息的
夕小瑶科技说 2025-10-21T14:00:44.000000Z
An Efficient Rubric-based Generative Verifier for Search-Augmented LLMs
cs.AI updates on arXiv.org 2025-10-17T04:18:51.000000Z
An Efficient Rubric-based Generative Verifier for Search-Augmented LLMs
cs.AI updates on arXiv.org 2025-10-17T04:18:51.000000Z
FaStFACT: Faster, Stronger Long-Form Factuality Evaluations in LLMs
cs.AI updates on arXiv.org 2025-10-16T04:23:50.000000Z
独家!DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
智源社区 2025-09-30T13:33:18.000000Z
DeepSeek最新模型上线,全新注意力机制基于北大ACL最佳论文
36氪 - AI相关文章 2025-09-30T00:19:17.000000Z
DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价
DeepSeek 2025-09-29T16:38:32.000000Z
强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码
机器之心 2025-09-29T16:37:49.000000Z
DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练
快科技资讯 2025-09-29T13:57:35.000000Z
火速!寒武纪Day 0适配DeepSeek-V3.2-Exp 并同步开源
快科技资讯 2025-09-29T13:23:55.000000Z
国庆前放大招!DeepSeek-V3.2-Exp发布并开源,API成本将降低50%以上
富途牛牛头条 2025-09-29T11:58:35.000000Z
国庆前放大招!DeepSeek-V3.2-Exp发布并开源,API成本将降低50%以上
华尔街见闻 - 最热文章 2025-09-29T11:38:11.000000Z
一刀砍掉90%训练成本!Qwen3-Next用1/10算力练成「长文推理利器」
新智元 2025-09-12T18:50:57.000000Z
杨植麟的反击
钛媒体:引领未来商业与生活新知 2025-07-23T11:01:44.000000Z
杨植麟的反击
36kr-科技 2025-07-23T08:49:59.000000Z
【ICML2025】大模型训练性能4倍提升!阿里云PAI团队研究成果ChunkFlow中选
掘金 人工智能 2025-07-17T07:50:57.000000Z
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
量子位 2025-07-09T07:14:47.000000Z
性能比肩DeepSeek-R1,MiniMax仅花380万训出推理大模型性价比新王|开源
智源社区 2025-06-18T04:12:47.000000Z
性能比肩 DeepSeek-R1,MiniMax 仅花 380 万训出推理大模型性价比新王|开源
掘金 人工智能 2025-06-17T10:36:17.000000Z
MiniMax开源超强性价比推理模型,未来四天连续“上新” | 云启伙伴
云启资本 2025-06-17T10:05:31.000000Z