热点
关于我们
xx
xx
"
模型量化
" 相关文章
清华&南洋理工等提出稀疏模型反演:ViT反演加速高达3.79倍,告别无效背景!
我爱计算机视觉
2025-11-05T08:40:34.000000Z
Rounding-Guided Backdoor Injection in Deep Learning Model Quantization
cs.AI updates on arXiv.org
2025-10-14T04:11:45.000000Z
My Notes From Spark+AI Summit 2020 (Application-Agnostic Talks)
https://eugeneyan.com/rss
2025-09-30T11:14:07.000000Z
Optimizing AI Models with Quanto on H100 GPUs
Hello Paperspace
2025-09-25T10:02:25.000000Z
关于 DeepSeek-R1 API 评测,至少有 7 个误区
OneFlow
2025-09-25T10:01:42.000000Z
Coding Implementation to End-to-End Transformer Model Optimization with Hugging Face Optimum, ONNX Runtime, and Quantization
MarkTechPost@AI
2025-09-23T23:51:09.000000Z
北京内推 | AMD北京AI算法团队招聘模型量化/剪枝算法实习生(可远程)
PaperWeekly
2025-09-11T10:55:05.000000Z
模型量化大揭秘:INT8、INT4量化对推理速度和精度的影响测试
掘金 人工智能
2025-08-20T04:16:41.000000Z
ReID/OSNet 算法模型量化转换实践
掘金 人工智能
2025-08-18T04:21:28.000000Z
【大模型微调】7.日志监控配置与模型量化分享
掘金 人工智能
2025-07-25T10:44:29.000000Z
Enhancing Vaccine Safety Surveillance: Extracting Vaccine Mentions from Emergency Department Triage Notes Using Fine-Tuned Large Language Models
cs.AI updates on arXiv.org
2025-07-11T04:03:57.000000Z
征程 6M 部署 Omnidet 感知模型
掘金 人工智能
2025-07-10T13:19:38.000000Z
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation
cs.AI updates on arXiv.org
2025-07-10T04:06:06.000000Z
征程 6|工具链量化简介与代码实操
掘金 人工智能
2025-07-09T02:20:11.000000Z
1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet,不用GPU也能运行
智源社区
2025-06-11T11:17:50.000000Z
征程 6EM 常见 QConfig 配置解读与示例
掘金 人工智能
2025-06-01T10:53:05.000000Z
多模态视觉理解大模型推理优化:探索AI的未来
掘金 人工智能
2025-05-22T01:58:07.000000Z
华为曝光两大黑科技!打破推理延迟魔咒,大模型从此「秒回」
掘金 人工智能
2025-05-21T06:08:04.000000Z
纯本地!零代码!一站式完整数据集准备到模型微调全流程!(一)
掘金 人工智能
2025-05-16T03:33:00.000000Z
大模型推理框架RTP-LLM Embedding技术揭秘
阿里技术
2025-04-09T10:06:08.000000Z