热点
关于我们
xx
xx
"
Vision-Language Models
" 相关文章
达摩院联合浙大、港理工推出PixelRefer:多模态大模型迈向像素级视觉理解
PaperWeekly
2025-11-06T16:29:51.000000Z
Dynamic Routing Between Experts: A Data-Efficient Approach to Continual Learning in Vision-Language Models
cs.AI updates on arXiv.org
2025-11-05T05:31:05.000000Z
世界模型==VQA?机器人不用想象画面,预测语义就够了
机器之心
2025-10-28T05:42:24.000000Z
Token-Level Inference-Time Alignment for Vision-Language Models
cs.AI updates on arXiv.org
2025-10-28T04:09:31.000000Z
世界模型==VQA?机器人不用想象画面,预测语义就够了
36氪 - AI相关文章
2025-10-28T03:16:03.000000Z
不重构、不牺牲通用性:VLM-FO1,为任何VLM无损增强细粒度感知能力
PaperWeekly
2025-10-23T13:23:59.000000Z
DeepSeek的终极野心:把大语言模型的基本语言都改造成图像
36氪 - AI相关文章
2025-10-21T18:50:41.000000Z
MIT成果登Nature正刊:90天,「AI科学家」完成3500次电化学测试
36氪 - AI相关文章
2025-10-21T02:51:57.000000Z
MIT成果登Nature正刊:90天,「AI科学家」完成3500次电化学测试
36氪 - AI相关文章
2025-10-21T02:51:57.000000Z
AGILE:视觉学习新范式!自监督+交互式强化学习助力VLMs感知与推理全面提升
机器之心
2025-10-20T13:32:57.000000Z
AGILE:视觉学习新范式!自监督+交互式强化学习助力VLMs感知与推理全面提升
机器之心
2025-10-20T13:32:57.000000Z
Vision-Zero:零数据VLM自我进化!陈怡然团队提出零监督训练新范式
PaperAgent
2025-10-17T10:02:43.000000Z
欧几里得的礼物:通过几何代理任务增强视觉-语言模型中的空间感知和推理能力
机器之心
2025-10-17T06:46:07.000000Z
Method teaches generative AI models to locate personalized objects
MIT News - Artificial intelligence
2025-10-16T04:21:57.000000Z
Method teaches generative AI models to locate personalized objects
MIT News - Artificial intelligence
2025-10-16T04:21:57.000000Z
When Does Supervised Training Pay Off? The Hidden Economics of Object Detection in the Era of Vision-Language Models
cs.AI updates on arXiv.org
2025-10-14T04:20:05.000000Z
Towards Self-Refinement of Vision-Language Models with Triangular Consistency
cs.AI updates on arXiv.org
2025-10-14T04:18:42.000000Z
Vision-Zero:零数据VLM自我进化!陈怡然团队提出零监督训练新范式
机器之心
2025-10-11T08:53:18.000000Z
东京大学、牛津大学等联合发布VLA万字综述:机器人迈向通用智能的全栈指南
我爱计算机视觉
2025-10-10T09:50:47.000000Z
Your Vision-Language Model Can't Even Count to 20: Exposing the Failures of VLMs in Compositional Counting
cs.AI updates on arXiv.org
2025-10-07T04:17:02.000000Z