多模态生成_Fishai

热点

"多模态生成" 相关文章

HMVLM: Human Motion-Vision-Lanuage Model via MoE LoRA

cs.AI updates on arXiv.org 2025-11-05T05:30:35.000000Z

OmniNWM：突破三维驾驶仿真极限的“全知”世界模型

我爱计算机视觉 2025-10-24T09:14:56.000000Z

Collaborative Text-to-Image Generation via Multi-Agent Reinforcement Learning and Semantic Fusion

cs.AI updates on arXiv.org 2025-10-14T04:09:14.000000Z

Collaborative Text-to-Image Generation via Multi-Agent Reinforcement Learning and Semantic Fusion

cs.AI updates on arXiv.org 2025-10-14T04:09:14.000000Z

复旦张军平：人类是硅基生命过渡体？

智源社区 2025-10-13T22:27:18.000000Z

科学家用AI预测下一个镜头，为影视剧等提供视觉和叙事一致的应用工具

DeepTech深科技 2025-10-09T04:30:23.000000Z

假期被玩坏了的奥特曼，正在玩弄全世界的算力

虎嗅 2025-10-07T23:50:53.000000Z

假期被玩坏了的奥特曼，正在玩弄全世界的算力

虎嗅 2025-10-07T23:50:53.000000Z

登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平

机器之心 2025-09-28T14:01:55.000000Z

登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平

机器之心 2025-09-28T12:03:52.000000Z

登上NeurIPS，Genesis开创无需OCC引导的多模态生成新范式，在视频与激光雷达指标上达到SOTA水平

机器之心 2025-09-28T09:31:05.000000Z

凌晨三点用完豆包Seedream 4.0后，我打算和NanoBanana说再见了

AI大模型工场 2025-09-25T10:01:34.000000Z

北京内推 | 清华×生数科技联合招聘音视频生成方向研究型实习生

PaperWeekly 2025-08-20T16:01:42.000000Z

腾讯 AI Lab 发布多模态音频生成工具 AudioGenie

oschina.net 2025-08-20T09:12:26.000000Z

Yan: Foundational Interactive Video Generation

cs.AI updates on arXiv.org 2025-08-13T04:15:47.000000Z

Efficient Agent: Optimizing Planning Capability for Multimodal Retrieval Augmented Generation

cs.AI updates on arXiv.org 2025-08-13T04:14:55.000000Z

首个基于昇腾MindSpeed MM训练的多模态生成理解统一模型Lumina-DiMOO正式发布

e公司-快讯 2025-07-31T13:14:54.000000Z

夸克、浙大开源OmniAvatar，一张图+一段音，就能生成长视频

机器之心 2025-07-25T10:19:42.000000Z

开源新基准！OmniGen2 文本图像对齐度提升 8.6%，视觉一致性超越现有开源模型15%

掘金人工智能 2025-07-23T09:05:42.000000Z

AI Prompt提示词基本原则与核心技巧

掘金人工智能 2025-07-21T10:33:22.000000Z

Copyright © 2019 FISHAI.All Rights Reserved