Flowith OS：为AI Agent打造原生操作系统

原创镜山 2025-10-28 21:08 北京

就像 Windows 或 macOS 为软件提供运行环境，Flowith OS 为 AI Agent 提供思考与行动的环境。

👦🏻 作者: 镜山

🥷 编辑: Koji

🧑‍🎨 排版: NCon

最近在 AI Agent 领域连续发生了 3 件值得标记一下的事：

其一是， 10 月 16 日，微软宣布将 Agent Manus 深度整合进 Windows 11 系统。微软正试图让 Agent 不仅停留在 ChatBot 层面，而是真正获得系统级的行动力。

其二是，10 月 22 日，OpenAI 发布了 AI 浏览器 Atlas。这是一个被外界视作「多模态 Agent 浏览器」的新入口，它让 AI 不仅能「读网页」，还能在真实网页环境中进行推理、决策与操作。

其三则是， Flowith 正式发布了一个全新的产品：名为 Flowith OS 的新物种。它选择了一个「另辟蹊径」的路径，尝试为 AI Agent 打造一个全新的 AI-Native 式的操作系统。

他们的方向其实是一致的：试图回答当前 AI 普遍存在的「思考与执行脱节」问题：跨网页、跨环境的执行困难，长任务的断点与割裂感，再加上「权限不敢给、执行力不足」。

🚥那么，Flowith OS 到底是什么？具体是如何为 Agent 打造这个原生环境的？它给出的答案又是什么？

带着这些问题，我们进行了一次深度的体验与观察。

首先，什么是 Flowith OS？「Flowith OS」这个名字听起来很新，也很大胆，使用了操作系统 OS 作为名称。

在深入体验之后，我们决定先来把这个名字讲清楚。

我们都熟悉「Agent」这个词。简单说，如果 ChatGPT 代表「思考的智能」：能理解、推理、生成内容，那么 Agent 就是「行动的智能」，能自主完成任务。

不过，目前，「让 AI Agent 去行动」仍非常困难。

为什么？

因为这意味着它必须走出聊天框，进入复杂、多变、非结构化的真实环境。它要能看懂网页文字、理解按钮功能、识别表单用途，还要明白不同软件之间的逻辑关联。

到目前为止，传统 Agent 仍然有 3 个限制：

【1】环境限制

Agent 被困在「沙盒」里。它们也许能在一个网页或插件中表现出色，但一旦任务涉及跨页面、跨平台或多网站协作，就显得力不从心。

【2】记忆缺失

传统 Agent 对于记忆的把控能力，仍然较弱。完成任务的多步骤之后，记忆的衔接就会出现割裂，缺乏连续性，就无法积累知识、优化策略，也谈不上理解用户的长期目标。

【3】对于权限的尝试，有些「恐惧症」

实话说，最后一个问题，更像是传统 Agent 产品的「心理障碍」。

尽管部分产品已经尝试赋予 Agent 向用户索取权限，但多数开发者仍对此，显得有些「心存顾虑」，尽量在不涉及用户私密权限的情况下，完成任务。

但是，这导致 Agent 无法像人一样自由调用系统资源，也无法长时间独立运行。一旦任务跨平台或需持续监控，就会立刻碰壁。

而 Flowith OS 就是想从底层，通过提供一个 AI-Native 的 OS 操作系统，试着解决这 3 点。就像 Windows 或 macOS 为软件提供运行环境，Flowith OS 为 AI Agent 提供思考与行动的环境。

不过，与深入微软 Windows 11 系统底层的 Manus 不同，Flowith OS 的思路选择了从整合浏览器 —— 这个涵盖了互联网上最多信息和服务的工具开始。

梳理完概念部分，让我们来看看 Flowith OS 到底面对这 3 个问题，能给出什么样的答案。

一场全自动的淘宝购物实验最近，十字路口团队往返新加坡和上海的次数越来越多，于是我决定测试一下，能不能让 Flowith OS 自动帮我在淘宝上准备一整套出国出差用品。

结果，这次的体验比我预想的更像「看着一个懂事的助理在帮你网购」。

Flowith OS 运行在一个独立的软件平台中。这个平台整合了之前我们在【全网首发】一手体验全新 AI Agent：Neo 是谁？从哪来？到哪去？文章中曾测过的 Flowith Agent —— Neo（在左侧栏可以找到），以及 Google 浏览器（可以直接搜索），最核心的部分是中间的 Flowith OS 面板。

在这里，你只需要输入任务提示词，然后点击「Run Task」，Agent 就会自动开始执行整套操作。

右侧显示的是它的工作流图，非常详细，还可以自由切换三种思考模式，代表 Agent 的思考强度。一般来说，选择 Auto 模式就足够流畅。

这次的任务是让 Flowith OS 帮我在淘宝上准备以下出差用品，提示词如下：

在淘宝网为我搜索并准备一套出国出差用的必备物品。包含：高品质旅行箱、MUJI风格洗漱套装、便携充电器、U型枕、旅行收纳袋等。优先选择大品牌（如 Samsonite、新秀丽、MUJI、Anker、小米等），并筛选评价高、有优惠活动或可领取优惠券的商品。自动帮我领取并应用可用优惠券，将合适的商品加入购物车但不要付款，等待我确认后再结算。执行步骤： 1️⃣ 按类别搜索评分最高的商品； 2️⃣ 对比价格、发货速度与正品标识； 3️⃣ 领取并应用优惠券； 4️⃣ 将筛选出的最优商品加入购物车； 5️⃣ 暂不付款，等待我确认。

点击「Run Task」后，Flowith OS 立刻开始执行任务。右下角的控制台显示出执行进度，整个过程非常快，大约 30 秒左右就完成了登录和首轮搜索。

这时候，淘宝就会弹出一个让我登录的选项。

过程经过加速，原操作流程大概 30 秒左右我扫码登录淘宝后，它首先去找「高品质旅行箱」。

几乎没有停顿，它就打开了 Diplomat（外交官）的旗舰店页面，并精准地将一款行李箱加入购物车。

接着，它返回淘宝首页，继续搜索「MUJI 风格洗漱套装」。

有意思的是，我这里特意观察了一下。光是这一页淘宝的页面之中，就有非常多的 Muji 洗漱套装：

从最后结果来看，它其实选择了第 1 列第 4 个 —— 「无印良品 MUJI 米糠发酵洗护套装旅行便携装」，这就有点意思了。

点开日志文件可以看到，它在识别阶段提取了页面信息，并依据「销售量最高 + 关键词匹配」这两个条件进行判断。

这说明它并不是「随机点选」，而是真的在做分析。

接下来，它搜索「便携U型枕」，进入了名创优品的一家淘宝店。

让我意外的是，虽然并不是所有场景都能实现，但 Flowith OS 确实能够实现通过点击页面进度条，来浏览更多商品信息。

不过，也有一个小问题。由于很多淘宝商品页面的「加入购物车」按钮区域很小，而大面积区域是「立即购买」，在这个时候，Flowith OS 就很有可能会出错。

日志文件里可以看到几次错误尝试，它将「立即购买」识别为「加入购物车」：

但在失败后又自动重试，直到成功为止：

整个任务大概持续了 5 到 10 分钟。相比传统的 AI Agent，它的执行速度明显更快，步骤也更稳定。而且会给我一种「它非常熟练」的体感。

下面来看看，Flowith OS 是否都完成了任务：

你能看到，Flowith OS 确实把「高品质旅行箱、MUJI 风格洗漱套装、便携充电器、U 型枕、旅行收纳袋」加入了购物车。

不过，美中不足的地方是，它定了 2 个「高品质旅行箱」：一个是 Diplomat 外交官行李箱，另一个则是小米旅行箱。

我原本以为它只是简单地加购物车，但后来想起检查优惠券时才发现，它真的自动领取了 Diplomat 行李箱的优惠券：

Flowith OS 完成这个任务一共用了 39 步。

从步数来看的话，Flowith OS 会表现得相对熟练一点，并没有浪费特别多的 token。

从测评到热搜的微博任务在完成淘宝购物的测试后，我开始意识到：Flowith OS 不只是能完成简单的搜索和加购任务。

它在后台同时处理多个网页、提取信息、执行动作，这意味着它具备了应对更复杂场景的潜力。

于是我决定挑战一下，看看它是否能完成一个更高难度的任务。

提示词：

帮我全面测评一下Pippit这个Capcut的产品，并将内容撰写成一篇测评文章，发在微博上，并且看一看能不能跟微博热搜上的内容产生联动效应

说实话，这次测试里，Flowith OS 的表现超出了预期。

执行后，Flowith OS 立刻打开了 YouTube 和 Pippit 官网，开始自动提取相关信息与要点摘要。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签