当然,这类结构化输出依然存在一些小瑕疵。比如在生成长文时,标题层级、排版样式、甚至某些代码块格式,可能还不太符合微博平台的最佳展示效果,需要手动微调。但整体而言,Flowith OS 已经展现出一种令人期待的可能性还不完美,但方向很对经常刷 X 平台科技话题的朋友都知道,很多名人发推之后,评论区总会被各种「水军」占满。于是我想:既然 Flowith OS 能这么流畅地发微博,那它能不能「扮演」一个水军,在评论区里自动刷屏呢?我给出的提示词是这样的:
执行后,Flowith OS 立刻开始行动:这个任务它一共做了224步。这 224 步之内,我特意去查了查,并没有发现非常错误的地方:很多人可能会好奇:Flowith OS 到底会不会出错?它出错时又是什么表现?我做了一个更复杂的案例,让它去自动抓取一个名为 Botto 的 AI 艺术品售卖网站的数据。这个网站长这样:左边展示艺术作品,右边是简要的文字信息。
我给它的提示词是:
Botto「Works」艺术作品采集与存储任务 任务目标: 请前往网站 https://botto.com/,进入 「Works」 功能板块。该页面展示了多个以「Period」为分类的艺术作品系列。 执行步骤: 打开 Botto 官网,导航至 「Works」 页面。 在页面中找到各个 Period(如 Genesis、Rebirth、Eclipse 等)。 对每一幅艺术作品,逐一执行以下操作: 下载或保存作品图片(高清或展示图)。 复制提取并记录右侧的全部基础信息,包括: 作品标题(如 Asymmetrical Liberation) 作品描述(如 “Asymmetrical Liberation is a planet in the Synedrion system…”) 所属 Period 名称(如 Genesis) Round(期次) VP 数值 Score 分数 Model 模型类型(如 VQGAN) Price(价格,单位为美元) 若页面中有「read more」或可展开的文本,请点击并提取完整内容。 将所有提取的数据整理为结构化表格,字段如下: 作品名 描述 Period Round VP Score Model Price 图片链接 按 Period 分类整理,每个 Period 独立分组,并按 Score 或 VP 值降序 排序。 附加任务: ✅ 将所有采集到的内容(含图片 URL 与作品信息)自动写入我的网页版飞书多维表格(Feishu Bitable)中,创建或更新对应字段。 若表格不存在,请自动创建名为 “Botto Works 数据库” 的新表。 字段映射与上方表格一致。 图片字段应支持图片预览。 每条记录唯一键为 “作品名 +Period”。
说实话,这个任务确实有点复杂。它涉及图片的本地保存等操作,而这类功能其实超出了它目前的能力范围。但真正让我惊讶的,是它在报错和执行失败后的表现。过去的 AI Agent,一旦遇到这种超出权限或能力的任务,往往会陷入死循环,卡在某一步,不停重试,最后只能「摆烂」。而 Flowith OS 不一样。即便它无法直接进行本地保存,或者网站本身没有开放 API,它依然会主动寻找替代方案。一个特别典型的例子:它先意识到自己不能直接下载网站内容,也找不到 API,于是开始自主搜索可能的接口。发现没有后,它又换了思路,居然找到了一个隐藏在 Botto 官方文档里的 Notion 数据库嵌入页,并试图从那里提取数据:这个任务,Flowith OS 足足尝试了 172 步,发现了很多种解法:直接抓取、API 接口、Botto 官方文档里隐藏的 Notion 数据库提取、甚至是走 Github 项目等等。换句话说,Flowith OS 已经展现出:在资源有限、信息不全的条件下,主动去寻找解决问题的可能性。更有意思的是,Flowith 的创始人已经「偷偷」用 Flowith OS 自动在小红书上发布 Blog 了:下面,我们来总结下 Flowith OS 这个新物种的核心逻辑。经历了前面的几轮实测,从淘宝自动购物,到微博热搜联动,再到 AI 艺术品数据爬取,你会发现,它与我们以往所接触的 Agent 不太一样。Flowith OS 的思维方式,明显更像一个「能在复杂环境中生长的个体」。它不再依赖单一接口或插件,而是直接在原生浏览器环境中进行任务执行,打开网页、提取信息、点击按钮、比对结果,甚至还能根据上下文自动调整路径。更重要的是,当 Flowith OS 遇到障碍时,它并不会立即放弃或报错,而是尝试新的路径、搜索替代方案、甚至主动探索外部资源。🚥Flowith OS 是一款极年轻、极年轻的 Agent 产品,它透露了背后团队的清晰目标:「构建基于新交互方式的 Agent、下一代互联网产品」。在短程任务中(200-300 步以内),它已经展现出「颇感惊喜」的流畅度与执行力。这印证了 Flowith OS 理念中的「流」(flow), Agent 能够依据意图,从全网找到信息,再把「想法」变成结果。当任务链条被拉长,步数达到数百步时,我们看到了它正在快速迭代和成长的「工作流衔接」能力。面对高价值、复杂度较高的任务(比如我让它抓取特定网站信息的案例里),它所展现的「努力找到解决方式」的态度,本身就是一种有价值的积极探索。正如这家年轻团队所言,对于我们想象中的未来 AI 世界,今天仅仅是 「Day 1」 而已。那么,现在我们也想听听你: