热点
"音频理解" 相关文章
英伟达新架构引爆全模态大模型革命,9B模型开源下载即破万
新智元 2025-11-07T14:29:30.000000Z
Audio-Maestro: Enhancing Large Audio-Language Models with Tool-Augmented Reasoning
cs.AI updates on arXiv.org 2025-10-14T04:20:18.000000Z
AudioMarathon: A Comprehensive Benchmark for Long-Context Audio Understanding and Efficiency in Audio LLMs
cs.AI updates on arXiv.org 2025-10-09T04:13:53.000000Z
小米开源声音理解大模型 MiDashengLM-7B
小米技术 2025-09-12T08:06:06.000000Z
社区供稿 | 开源SOTA:阶跃发布端到端语音大模型Step-Audio 2 mini!
智源社区 2025-09-04T09:51:16.000000Z
小米开源声音理解大模型 MiDashengLM-7B
小米技术 2025-08-06T18:06:14.000000Z
MECAT: A Multi-Experts Constructed Benchmark for Fine-Grained Audio Understanding Tasks
cs.AI updates on arXiv.org 2025-08-01T04:08:24.000000Z
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
智源社区 2024-12-12T15:47:34.000000Z
摩尔线程正式开源音频理解大模型MooER
界面快报 2024-08-23T23:49:47.000000Z
摩尔线程开源音频理解大模型MooER:38小时训练5000小时数据
快科技资讯 2024-08-23T12:01:32.000000Z
摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理
IT之家 2024-08-23T10:37:29.000000Z
VideoLLaMA 2 Released: A Set of Video Large Language Models Designed to Advance Multimodal Research in the Arena of Video-Language Modeling
MarkTechPost@AI 2024-08-15T08:19:57.000000Z
阿里通义开源音频语言模型Qwen2-Audio,相关论文入选顶会ACL 2024
ReadHub 2024-08-13T03:38:05.000000Z
阿里通义开源音频语言模型Qwen2-Audio 相关论文入选顶会ACL 2024
格隆汇快讯 2024-08-13T03:35:30.000000Z