热点
"视觉表征" 相关文章
Don't Blind Your VLA: Aligning Visual Representations for OOD Generalization
cs.AI updates on arXiv.org 2025-10-30T04:20:32.000000Z
DualCap: Enhancing Lightweight Image Captioning via Dual Retrieval with Similar Scenes Visual Prompts
cs.AI updates on arXiv.org 2025-10-30T04:15:36.000000Z
精读DeepSeek OCR论文,我远远看到了「世界模型」的轮廓
钛媒体:引领未来商业与生活新知 2025-10-27T02:33:08.000000Z
ICCV 2025 | 浙大、港中文等提出EgoAgent:第一人称感知-行动-预测一体化智能体
机器之心 2025-10-16T06:15:32.000000Z
Being-VL的视觉BPE路线:把「看」和「说」真正统一起来
机器之心 2025-10-09T08:29:55.000000Z
Harmon:协调视觉表征,统一多模态理解和生成(模型已开源)
机器之心 2025-05-14T05:26:27.000000Z
登顶Hugging Face总榜,创始人Clem点赞转发,OCR-2.0火了!
阶跃星辰 2024-10-28T00:07:35.000000Z
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
智源社区 2024-10-24T03:23:48.000000Z
扩散模型训练方法一直错了!谢赛宁:Representation matters
机器之心 2024-10-14T07:12:09.000000Z
LeCun谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V
36kr 2024-06-27T12:03:50.000000Z