IT之家 10月01日
火山引擎发布豆包大模型1.6-vision
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

火山引擎发布具备工具调用能力的视觉深度思考模型豆包大模型1.6-vision,具有多模态理解和推理能力,支持高阶视觉理解精准度需求,综合成本降低约50%。

IT之家 10 月 1 日消息,火山引擎昨日宣布正式推出豆包大模型 1.6-vision,这是豆包大模型家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力,并支持 Responses API,以更高性价比更好满足客户在视觉理解精准度上的高阶需求。

据官方介绍,豆包大模型 1.6-vision 以工具调用的差异化能力,将图像融入其思维链中,实现对图片的定位、剪裁、点选、画线、缩放、旋转等精细处理。并通过模拟人类从“从全局扫描到局部聚焦”的视觉推理过程,在增强推理可解释性的同时,可高效精准地完成图像操作。

与上一代 Doubao-1.5-thinking-vision-pro 相比,豆包大模型 1.6-vision 综合成本降低约 50%。以用户最常用的 32K 输入输出场景为例,成本从 5.25 元降至 2.6 元。

IT之家注意到,今年 6 月,火山引擎曾推出豆包大模型 1.6,以多模态思考能力强化了对复杂场景的理解。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

火山引擎 豆包大模型 视觉深度思考模型
相关文章