热点
"视觉理解" 相关文章
豆包也开始抢程序员饭碗了,一个月只要9块9。。
掘金 人工智能 2025-11-14T02:20:32.000000Z
字节杀疯了!9.9元包月的编程模型,国内唯一能看图写代码的
AI产品黄叔 2025-11-11T16:32:39.000000Z
不怕Claude断供!豆包编程模型来了,5分钟造“我的世界”翻版,花费2毛钱
2025-11-11T13:41:28.000000Z
不怕Claude断供,豆包编程模型来了,5分钟造“我的世界”翻版,花费2毛钱
36kr-科技 2025-11-11T09:35:48.000000Z
火山引擎发布豆包编程模型
oschina.net 2025-11-11T07:31:14.000000Z
豆包编程模型正式发布!综合使用成本降低62.7% 国内最低价
快科技资讯 2025-11-11T07:09:37.000000Z
OCR的新高度?PaddleOCR-VL 与 DeepSeek-OCR 的技术与应用横评
掘金人工智能本月最热 2025-11-03T10:45:34.000000Z
Rethinking Visual Intelligence: Insights from Video Pretraining
cs.AI updates on arXiv.org 2025-10-29T04:28:22.000000Z
[分享发现] 发现智谱 AI 的 coding 套餐有 1024 特惠,有需要的朋友可以尝试一下了
V2EX 2025-10-24T09:19:19.000000Z
Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs
cs.AI updates on arXiv.org 2025-10-22T04:26:09.000000Z
Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs
cs.AI updates on arXiv.org 2025-10-22T04:26:09.000000Z
RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward
机器之心 2025-10-21T06:37:48.000000Z
AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式
量子位 2025-10-16T10:00:01.000000Z
不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出
机器之心 2025-10-16T06:43:35.000000Z
VLURes: Benchmarking VLM Visual and Linguistic Understanding in Low-Resource Languages
cs.AI updates on arXiv.org 2025-10-16T04:23:54.000000Z
AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式
36kr-科技 2025-10-15T14:06:44.000000Z
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
IT之家 2025-10-15T05:01:32.000000Z
硅基流动上线阿里视觉模型 Qwen3-VL
硅基流动 2025-10-14T09:35:08.000000Z
Into the Rabbit Hull: From Task-Relevant Concepts in DINO to Minkowski Geometry
cs.AI updates on arXiv.org 2025-10-13T04:12:45.000000Z
告别AI“乱画图表”!港中文团队发布首个结构化图像生成编辑系统
智源社区 2025-10-12T21:43:53.000000Z