掘金 人工智能 08月20日
小白玩转 DINO-X MCP(2):基于 DINO-X MCP 搭建饮食规划工作流
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文详细介绍了如何利用 DINO-X MCP 构建一个集食材识别、食谱规划和信息同步于一体的智能工作流。通过集成 DINO-X MCP、How to Cook MCP 和 Notion MCP,用户可以上传食材图片,由大模型自动识别,并根据识别结果生成个性化食谱,最终将食谱及相关信息保存到 Notion。这种工作流模式突破了单一 AI 模型的能力限制,展现了 MCP 在连接外部专业工具、实现复杂任务自动化方面的强大潜力,为开发专业的 AI 应用提供了实践范例。

💡 **MCP 的核心价值在于突破 AI 模型边界,实现与外部专业工具的快速集成。** DINO-X MCP 的工作流由大模型根据任务需求自行决定调用哪些工具(MCP Server)及其顺序,而非预设固定流程。模型通过解析系统指令和用户输入,识别可用工具,将任务拆解为子任务,匹配合适的工具调用。对于无需工具的任务,模型直接回复;需要时,则生成结构化工具调用请求,由客户端执行,并将结果反馈给模型,最终生成完整答复。

🍽️ **以营养饮食规划为例,展示了 DINO-X MCP 构建实用工作流的流程。** 文章以开发一款营养饮食规划 APP 为例,演示了如何通过 Cursor IDE 集成 DINO-X MCP、How to Cook MCP 和 Notion MCP。首先,在 MCP 设置界面导入这三个 MCP Server 的 JSON 配置,并完成 Notion MCP 的授权。随后,用户可以通过自然语言输入包含食材图片的指令,例如“我感冒喉咙痛,请检测图片食材并规划食谱,最后分享到 Notion”。

📊 **工作流执行过程包括食材识别、食谱规划和信息同步三个主要步骤。** 当接收到用户的指令后,Cursor 的大模型(以“Auto”模式为例)会首先调用 DINO-X MCP 分析图片中的食材。接着,调用 How to Cook MCP 根据识别出的食材生成营养食谱,并提供饮食建议和注意事项。最后,通过 Notion MCP 将生成的食谱和相关信息记录到 Notion 授权空间中的新页面,完成整个智能工作流的闭环。

🚀 **DINO-X 视觉模型在复杂场景下表现出色,为构建专业 AI 应用奠定基础。** 相较于多模态大语言模型,DINO-X 视觉模型在目标检测和识别方面更为精细,尤其在密集、复杂的场景下,能够精准定位并识别所有内容。这使得基于 DINO-X MCP 构建的应用 Demo(如饮食规划 APP)能够提供更专业、更精细的用户体验,并为后续产品 MVP 的开发和优化提供有力支持。

上一篇文章中,我们详细介绍了如何在 Cursor 或 Trae 中启动并调用 DINO-X MCP。但在实际场景中,要让模型执行专业且复杂的任务,往往需要构建清晰的工作流 —— 这意味着仅依靠 DINO-X MCP 进行目标检测与识别远远不够,还需借助大量外部专业工具处理特定领域或节点的信息。而 MCP 的核心价值正在于此:它突破了 AI 模型的能力边界,使其能与众多外部能力(如各类软件 API)快速集成。

本文将结合模型选择 MCP 的基本原理,以营养饮食规划为例,手把手讲解如何构建一套基于 DINO-X MCP 的工作流。

一、模型如何选择 MCP

不同于预设的固定工作流(比如 Dify 工作流),在由 MCP 组成的工作流中,是否调用 MCP、调用 MCP 的类型以及顺序是由大模型自行决定的。提供更丰富的 MCP 选项有助于大模型更精准、流畅地完成任务,但这并不意味着模型一定会使用所有工具。

在实际交互过程中,大模型接收的输入包括两部分:1)一段包含 MCP Server 列表及具体用法的结构化系统指令(System Prompt);2)用户的自然语言输入。获取这些信息后,大模型会按以下逻辑处理:

1. 识别可用工具:通过解析 System Prompt,明确当前可调用的工具(即 MCP Server 中包含的功能)。

2. 任务拆解与工具匹配:基于用户输入分析需求,将其拆解为若干具体子任务(Case),并结合现有工具信息判断这些子任务是否需要调用 MCP:

(1)对于部分无需调用 MCP 的任务,模型会直接生成自然语言回复;

(2)需要调用 MCP 时,模型会向 MCP 客户端输出结构化的工具调用请求,由客户端通过 MCP Server 执行指令。最终,工具的执行结果会与 System Prompt、用户消息一同重新反馈给模型,供其生成最终回复。

3. 生成最终答复:综合上述过程,输出自然语言形式的结果。

二、基于 DINO-X MCP 的饮食规划工作流

一个非常适用于 DINO-X MCP 的应用场景是,开发者可以通过快速搭建一个 MCP 产品工作流来实现视觉产品 Demo。

相比起多模态大语言模型,DINO-X 视觉模型在检测与识别性能上更为精细 —— 尤其在复杂密集的场景中(如繁华街道、拥挤人潮、琳琅满目的货物等),它不仅能够精准定位指定的目标,还可凭借万物识别能力,将图像中的所有内容完整检测出来。

假设我们计划基于 DINO-X 模型 API 开发一款营养饮食规划 APP,那么在项目 POC 阶段或立项前期,便可借助 DINO-X MCP 快速搭建产品工作流。在本案例中,我们从第三方 MCP 市场选择了 How to Cook MCP 以及 Notion MCP,最终与 DINO-X MCP 组成完整的 MCP 工作流:

1. 导入 MCP Server

以 Cursor 为例,进入 Cursor IDE 页面,点击左侧的 “Tools & Integrations” 按钮,进入 MCP 设置界面。

在弹出的 JSON 配置页面中填写所需的 MCP Server 的 JSON 内容(具体的导入教程请参见《小白玩转 DINO-X MCP(1):如何接入 MCP Server ),3 个 MCP Server 对应的配置代码分别如下:

(1)DINO-X MCP (远程调用)

官方网址:github.com/IDEA-Resear…

{  "mcpServers": {    "dinox-mcp": {      "url": "https://mcp.deepdataspace.com/mcp?key=your-api-key"    }  }}

其中,'your-api-key' 替换为 DINO-X 开放平台的 API Key。

(2)How to Cook MCP (远程调用)

第三方网址:mcp.so/server/howt…

{  "mcpServers": {    "howtocook-mcp": {      "command": "npx",      "args": [        "-y",        "howtocook-mcp"      ]    }  }}

(3)Notion MCP

官方网址:developers.notion.com/docs/get-st…

{  "mcpServers": {    "Notion": {      "url": "https://mcp.notion.com/mcp"    }  }}

最终导入多个 MCP Server 的 Json 代码长这样:

{  "mcpServers": {    "howtocook-mcp": {      "command": "npx",      "args": [        "-y",        "howtocook-mcp"      ]    },     "dinox-mcp": {          "url": "https://mcp.deepdataspace.com/mcp?key=your-api-key"    },         "Notion": {          "url": "https://mcp.notion.com/mcp"    }      }}

保存并关闭 MCP Json 代码界面:

返回设置页面,并接入 “Tool&Integrations” 界面,我们会看到 MCP Server 已经导入成功,并且 Notion MCP 提示需要授权登录,按照指示登录 Notion,并完成授权即可。

Notion MCP 完成登录和授权以后,会变成绿色提示“导入成功”:

这款基于 DINO-X 模型的饮食规划产品 Demo 就搭建完成了!接下来我们进行简单的应用测试(按 Ctrl + l 弹出对话框)。

2. 饮食规划效果测试

假设 Bob 最近有点感冒,并且喉咙痛,打开冰箱,发现家里只剩下这些食材:

于是他把食材照片提供给饮食规划工作流,并输入:

我最近有点感冒,并且喉咙很痛,请帮我检测 file://xxx(你的图片文件路径)有哪些食材,并根据这些食材帮我规划最近 2 天 1 个人的食谱,最后把食谱分享到 notion。

在接收指令以后,Cursor 的大模型(这里用的是 “Auto” 模式)会开始分析并决定调用哪些 MCP:

(1)第一步,调用 DINO-X MCP 分析图片中包含哪些食材。

(2)第二步,调用 How to Cook MCP 来规划食谱。

(3)第三步,把食谱分享到 Notion。

最后大模型给出完整的输出:

(1)主要食材

(2)营养食谱

在这里,大模型还贴心地给出了饮食建议:

并参考食谱提醒了需要补充的材料以及其他注意事项:

(3)把食谱记录到 Notion

通过调用 Notion MCP,大模型在已经授权的私人 Notion 空间创建了一个专门的页面,用来记录食谱以及相关注意事项。

最终生成的 Notion 页面如下:

最后,这个基于 DINO-X MCP 的饮食规划工作流就完成啦!

我们可以通过这一流程测试基于 DINO-X 模型 API 搭建专门的 APP 会有什么样的效果,并据此优化用户交互流程以及产品工作流,实现进阶的产品 MVP。

参考资源

1. 安装 npx 依赖环境nodejs.org/

2. 申请 DINO-X API Keycloud.deepdataspace.com/

3. DINO-X MCP Githubgithub.com/IDEA-Resear…

4. How to Cook MCP 第三方网址mcp.so/server/howt…

5. Notion MCP 官方网址developers.notion.com/docs/get-st…

6. Cursor 官方下载链接www.cursor.com/

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

DINO-X MCP AI工作流 饮食规划 模型集成 Notion
相关文章