热点
关于我们
xx
xx
"
Inference Speed
" 相关文章
RWKV7-G0a3 13.3B 发布:世界最强纯 RNN 大语言模型
RWKV元始智能
2025-11-03T11:59:12.000000Z
RWKV7-G0a2 7.2B发布:纯RNN也能vibe coding
RWKV元始智能
2025-10-10T12:11:02.000000Z
3B参数差点干翻32B模型,Qwen3 Next 是如何做到的?
掘金 人工智能
2025-10-08T04:48:54.000000Z
硅基流动上线阿里通义千问 Qwen3-Next-80B-A3B
硅基流动
2025-09-25T02:34:18.000000Z
Coding Implementation to End-to-End Transformer Model Optimization with Hugging Face Optimum, ONNX Runtime, and Quantization
MarkTechPost@AI
2025-09-23T23:51:09.000000Z
社区供稿丨基座上新:MiniCPM 4.1 将「高效深思考」引入端侧
智源社区
2025-09-13T04:40:26.000000Z
冲上热搜!美团大模型,靠「快」火了
掘金 人工智能
2025-09-03T06:10:42.000000Z
动态压缩CoT!浙大×蚂蚁发布LightThinker,让模型推理“轻起来”
PaperWeekly
2025-09-01T15:01:23.000000Z
美团正式发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
美团技术
2025-09-01T08:35:58.000000Z
推理速度快50倍,MIT团队提出FASTSOLV模型,实现任意温度下的小分子溶解度预测
36氪 - 科技频道
2025-08-26T07:26:44.000000Z