本文探讨了开发一个用于仓储管理的智能体所面临的技术问题。主要关注以下几个方面:智能体API调用的入参格式限制,特别是JSON格式的prompt和data;智能体如何根据prompt解析指令并执行预设工作流;在工作流中集成API调用以查询物品信息,以及如何处理语义差异导致的查询失败;以及prompt是否需要提前训练,以及如何应对API库中找不到对应物品信息的情况,并考虑将数据库作为学习对象的可行性。作者寻求关于这些问题的解决方案和建议。
📦 **API入参格式与解析**:在自定义开发智能体后,可以通过API请求调用,并限制入参为JSON格式,其中包含用于接收提示词触发指令的`prompt`字段和携带业务参数的`data`字段。智能体能够根据`prompt`中的指令,如“入库”,自动执行相应的配置工作流,实现指令与工作流的灵活匹配。
🔍 **工作流与API集成及语义匹配**:在入库等工作流中,可以插入API调用,让智能体去外部API查询物品信息。然而,当用户输入的物品名称与API接口查询到的名称存在语义差异时(例如,用户输入“杯子”,API只能查到“保温杯”),可能导致AI无法匹配物品信息而入库失败。需要考虑更强大的语义匹配或模糊匹配机制。
🧠 **Prompt训练与数据库学习**:对于智能体,`prompt`可能需要提前进行训练,通过大量的语义数据提取关键信息,如物品名称。当智能体通过API查询不到用户输入的物品时,可以考虑是否能通过其他方式(如模糊匹配、近义词扩展)来解决,或者是否可以将数据库作为智能体的学习对象,以增强其对物品信息的理解和匹配能力。
各位大佬,我们公司有一个小的仓储管理系统,老板想开发一个智能体,能够帮助用户快速的管理仓储,昨天学习了一天还是有些问题没有搞明白,求教各位大佬:
1.自定义开发智能体后,通过 api 请求调用,能否限制入参只能是 json 格式,比如 json 结构的 prompt 和 data 数据,顾名思义 prompt 用于智能体接收提示词来触发指令,data 里面就是携带各种业务参数;
2.关于智能体对于接收的入参的解析,比如说 prompt 里面包含了指令入库,是否可以让他执行配置好的工作流,反之不同的 prompt 执行对应的工作流;
3.当用户入库某件物品时,能否在工作流里面插入 api ,让智能体去 api 里面查找这个物品,这个还涉及到一个问题,举例:入库杯子 1 个,实际上我的 api 接口只能查出来保温杯,但是提示词又是说的杯子,这样的话会导致 ai 通过 api 查不出这个物品信息,导致入不了库;
4.prompt 是否需要提前训练这个智能体,让智能体通过大量的语义去提取出关键信息,其实关键信息就是物品名,这个对应的问题是第三点,要是输入给智能体的关键字在 api 库里面找不到咋办(实际上是有这个物品的只是表达的语义不一样),学习的对象能否是数据库。
综上所述,各位大佬能否给点参考意见,不胜感激!