热点
"模态对齐" 相关文章
Centering Emotion Hotspots: Multimodal Local-Global Fusion and Cross-Modal Alignment for Emotion Recognition in Conversations
cs.AI updates on arXiv.org 2025-10-13T04:12:19.000000Z
A TRIANGLE Enables Multimodal Alignment Beyond Cosine Similarity
cs.AI updates on arXiv.org 2025-09-30T04:07:17.000000Z
LLM为什么能看懂图?秘密不在Projector,残差结构才是跨模态理解的关键
PaperWeekly 2025-08-18T16:03:14.000000Z
媒体实测7款AI数手指:几乎全翻车 仅一款正确 原因其实很简单
快科技资讯 2025-08-16T03:02:37.000000Z
Stream-Omni:同时支持各种模态组合交互的文本-视觉-语音多模态大模型
机器之心 2025-07-07T11:42:37.000000Z