视觉理解_Fishai

热点

"视觉理解" 相关文章

豆包也开始抢程序员饭碗了，一个月只要9块9。。

掘金人工智能 2025-11-14T02:20:32.000000Z

字节杀疯了！9.9元包月的编程模型，国内唯一能看图写代码的

AI产品黄叔 2025-11-11T16:32:39.000000Z

不怕Claude断供！豆包编程模型来了，5分钟造“我的世界”翻版，花费2毛钱

2025-11-11T13:41:28.000000Z

不怕Claude断供，豆包编程模型来了，5分钟造“我的世界”翻版，花费2毛钱

36kr-科技 2025-11-11T09:35:48.000000Z

火山引擎发布豆包编程模型

oschina.net 2025-11-11T07:31:14.000000Z

豆包编程模型正式发布！综合使用成本降低62.7% 国内最低价

快科技资讯 2025-11-11T07:09:37.000000Z

OCR的新高度？PaddleOCR-VL 与 DeepSeek-OCR 的技术与应用横评

掘金人工智能本月最热 2025-11-03T10:45:34.000000Z

Rethinking Visual Intelligence: Insights from Video Pretraining

cs.AI updates on arXiv.org 2025-10-29T04:28:22.000000Z

[分享发现] 发现智谱 AI 的 coding 套餐有 1024 特惠，有需要的朋友可以尝试一下了

V2EX 2025-10-24T09:19:19.000000Z

Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs

cs.AI updates on arXiv.org 2025-10-22T04:26:09.000000Z

Grasp Any Region: Towards Precise, Contextual Pixel Understanding for Multimodal LLMs

cs.AI updates on arXiv.org 2025-10-22T04:26:09.000000Z

RewardMap: 通过多阶段强化学习解决细粒度视觉推理的Sparse Reward

机器之心 2025-10-21T06:37:48.000000Z

AI玩拼图游戏暴涨视觉理解力，告别文本中心训练，无需标注的多模态大模型后训练范式

量子位 2025-10-16T10:00:01.000000Z

不再靠「猜坐标」！颜水成团队等联合发布PaDT多模态大模型：实现真正的多模态表征输出

机器之心 2025-10-16T06:43:35.000000Z

VLURes: Benchmarking VLM Visual and Linguistic Understanding in Low-Resource Languages

cs.AI updates on arXiv.org 2025-10-16T04:23:54.000000Z

AI玩拼图游戏暴涨视觉理解力，告别文本中心训练，无需标注的多模态大模型后训练范式

36kr-科技 2025-10-15T14:06:44.000000Z

超越 GPT-5 Nano，阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线

IT之家 2025-10-15T05:01:32.000000Z

硅基流动上线阿里视觉模型 Qwen3-VL

硅基流动 2025-10-14T09:35:08.000000Z

Into the Rabbit Hull: From Task-Relevant Concepts in DINO to Minkowski Geometry

cs.AI updates on arXiv.org 2025-10-13T04:12:45.000000Z

告别AI“乱画图表”！港中文团队发布首个结构化图像生成编辑系统

智源社区 2025-10-12T21:43:53.000000Z

Copyright © 2019 FISHAI.All Rights Reserved