模型量化_Fishai

热点

"模型量化" 相关文章

清华&南洋理工等提出稀疏模型反演：ViT反演加速高达3.79倍，告别无效背景！

我爱计算机视觉 2025-11-05T08:40:34.000000Z

Rounding-Guided Backdoor Injection in Deep Learning Model Quantization

cs.AI updates on arXiv.org 2025-10-14T04:11:45.000000Z

My Notes From Spark+AI Summit 2020 (Application-Agnostic Talks)

https://eugeneyan.com/rss 2025-09-30T11:14:07.000000Z

Optimizing AI Models with Quanto on H100 GPUs

Hello Paperspace 2025-09-25T10:02:25.000000Z

关于 DeepSeek-R1 API 评测，至少有 7 个误区

OneFlow 2025-09-25T10:01:42.000000Z

Coding Implementation to End-to-End Transformer Model Optimization with Hugging Face Optimum, ONNX Runtime, and Quantization

MarkTechPost@AI 2025-09-23T23:51:09.000000Z

北京内推 | AMD北京AI算法团队招聘模型量化/剪枝算法实习生（可远程）

PaperWeekly 2025-09-11T10:55:05.000000Z

模型量化大揭秘：INT8、INT4量化对推理速度和精度的影响测试

掘金人工智能 2025-08-20T04:16:41.000000Z

ReID/OSNet 算法模型量化转换实践

掘金人工智能 2025-08-18T04:21:28.000000Z

【大模型微调】7.日志监控配置与模型量化分享

掘金人工智能 2025-07-25T10:44:29.000000Z

Enhancing Vaccine Safety Surveillance: Extracting Vaccine Mentions from Emergency Department Triage Notes Using Fine-Tuned Large Language Models

cs.AI updates on arXiv.org 2025-07-11T04:03:57.000000Z

征程 6M 部署 Omnidet 感知模型

掘金人工智能 2025-07-10T13:19:38.000000Z

DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation

cs.AI updates on arXiv.org 2025-07-10T04:06:06.000000Z

征程 6｜工具链量化简介与代码实操

掘金人工智能 2025-07-09T02:20:11.000000Z

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

智源社区 2025-06-11T11:17:50.000000Z

征程 6EM 常见 QConfig 配置解读与示例

掘金人工智能 2025-06-01T10:53:05.000000Z

多模态视觉理解大模型推理优化：探索AI的未来

掘金人工智能 2025-05-22T01:58:07.000000Z

华为曝光两大黑科技！打破推理延迟魔咒，大模型从此「秒回」

掘金人工智能 2025-05-21T06:08:04.000000Z

纯本地！零代码！一站式完整数据集准备到模型微调全流程！（一）

掘金人工智能 2025-05-16T03:33:00.000000Z

大模型推理框架RTP-LLM Embedding技术揭秘

阿里技术 2025-04-09T10:06:08.000000Z

Copyright © 2019 FISHAI.All Rights Reserved