热点
关于我们
xx
xx
"
模型加速
" 相关文章
推理效率狂飙60倍:DiDi-Instruct让扩散大模型16步超越千步GPT
机器之心
2025-10-27T09:42:20.000000Z
如果RL可预测,我们还需要把训练跑满吗?中科大揭示参数更新的线性秘密
PaperWeekly
2025-10-14T14:42:26.000000Z
Beyond Next-Token Prediction: A Performance Characterization of Diffusion versus Autoregressive Language Models
cs.AI updates on arXiv.org
2025-10-07T04:16:29.000000Z
ChunkLLM: A Lightweight Pluggable Framework for Accelerating LLMs Inference
cs.AI updates on arXiv.org
2025-10-06T04:24:57.000000Z
DC-VideoGen: Efficient Video Generation with Deep Compression Video Autoencoder
cs.AI updates on arXiv.org
2025-09-30T04:08:01.000000Z
Data-Efficient Training by Evolved Sampling
cs.AI updates on arXiv.org
2025-09-30T04:04:40.000000Z
Self-Speculative Biased Decoding for Faster Live Translation
cs.AI updates on arXiv.org
2025-09-29T04:15:00.000000Z
No Title
Groq Blog
2025-09-28T15:41:50.000000Z
可训练动态稀疏注意力来了:港科大&智源联合提出高效长序列大模型新解法
智源社区
2025-09-05T06:42:57.000000Z
Lightning Fast Caching-based Parallel Denoising Prediction for Accelerating Talking Head Generation
cs.AI updates on arXiv.org
2025-09-03T04:16:50.000000Z
大模型部署避坑指南:资源、速度与实战要点解析
掘金 人工智能
2025-08-04T12:53:19.000000Z
ICCV 2025 | 视觉Token跳起来!上交大×蚂蚁联手推出多模态通用加速框架
PaperWeekly
2025-07-14T00:18:59.000000Z
ICCV 2025 | 视觉Token跳起来!上交大×蚂蚁联手推出多模态通用加速框架
PaperWeekly
2025-07-10T15:37:47.000000Z
大模型“越用越快”,SpeedupLLM首次验证,大降56%推理预算
36氪 - 科技频道
2025-07-10T01:59:20.000000Z
ICCV2025 | Skip-Vision,为视觉-语言模型打造通用加速框架
我爱计算机视觉
2025-07-09T01:41:31.000000Z
ICCV2025 | Skip-Vision,为视觉-语言模型打造通用加速框架
我爱计算机视觉
2025-07-04T13:22:30.000000Z
训练时间可缩短 50%,阿里云推出自动驾驶模型加速框架 PAI-TurboX
IT之家
2025-06-23T08:07:32.000000Z
Whisper 模型推理终极加速指南:CTranslate2 从入门到精通
掘金 人工智能
2025-06-22T06:54:18.000000Z
达摩院 ICLR'25 | Dynamic Diffusion Transformer
阿里技术
2025-04-18T03:21:17.000000Z
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
智源社区
2025-04-04T06:12:48.000000Z