Datawhale 11月13日 04:34
AI 辅助重构开源项目 HearSight 经验分享
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文作者分享了使用火山引擎豆包编程模型 Doubao-Seed-Code 辅助开源项目 HearSight 进行多源内容导入功能重构的实践经验。作者详细介绍了如何通过 Agentic Coding 的协作方式,利用 Doubao-Seed-Code 的 256K 长上下文能力,成功实现了对小宇宙播客、YouTube 等平台内容的导入,并保持了原有功能的稳定性。文章着重阐述了“阅读先行,编辑授权”的协作方法论,以及模型在主动感知、文件反哺、多文件同步编辑等方面的 Agentic 能力。作者还对使用成本进行了评估,认为其经济实惠。

💡 **AI 辅助编程的必要性与模型选择**:在面对信息量大、系统复杂的开源项目维护需求时,AI 编程助手能有效缓解人脑上下文记忆的压力。作者选择了火山引擎发布的 Doubao-Seed-Code 模型,因其主打 Agentic Coding 优化和 256K 的超长上下文,适合处理跨文件、多模块协同的重构任务,并在多项测评中表现出色。

🚀 **“阅读先行,编辑授权”的协作方法论**:作者总结了一套行之有效的 AI 编程协作方法论。首先,通过对话式讨论,让模型“阅读先行”,逐步构建上下文,模型能主动感知并反哺相关文件,确保上下文的完整性。在上下文建立后,进入“编辑授权”阶段,开发者审核模型提出的修改计划(TODO List),实现“开发者审核策略,AI 执行”的中间层级授权,确保修改的准确性和可控性。

✨ **Doubao-Seed-Code 的 Agentic 能力与长上下文优势**:实践证明,Doubao-Seed-Code 在 Agentic 规划能力和 256K 长上下文方面表现突出。它能主动发现并加载与任务高度相关的文件,避免上下文残缺;在代码编辑过程中,能清晰记忆并遵循编程规范,减少“遗忘”问题;在前端文件修改时,展现出批处理式的编辑能力,能一次性同步修改多个文件中的多处内容,显著提升了跨文件重构的效率。

💰 **经济实惠的成本效益**:作者对此次重构的成本进行了评估,使用火山方舟的 Coding Plan Lite 套餐,花费接近一杯瑞幸咖啡的价格,即可完成大量 Token 的调用和多次模型交互。这表明使用 Doubao-Seed-Code 进行复杂的 AI 辅助编程任务,在成本上具有较高的可行性和吸引力。

原创 筱可 2025-11-12 20:44 浙江

 Datawhale干货 

作者:筱可,Datawhale成员

实测项目背景

我有一个维护中的开源项目 HearSight——一个基于 AI 的视频辅助阅读工具:https://github.com/li-xiu-qi/HearSight

最近项目新的需求是:希望支持多源内容导入——不仅仅是 Bilibili,还要能从小宇宙播客、YouTube 等平台导入内容。

这类改造虽然代码不复杂,但涉及前后端多模块协同,任何一次改动都必须同时协调两端。如果其中一端实现有误,测试和回溯的成本就会比较高。这种息量大、系统复杂,人脑无法同时 hold 住所有上下文的情况就很适合使用AI来协助编程。

所以我用了火山引擎新发布的豆包编程模型 Doubao-Seed-Code,主打 Agentic Coding 优化,并提供 256K 的原生长上下文,契合我这种复杂、跨文件的修改任务。

从公开测评结果来看,在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等主流测评集中,Doubao-Seed-Code 表现出色,仅次于Claude Sonnet 4.5。

使用Doubao-Seed-Code模型

我使用火山引擎的 veCLI 终端搭配 Doubao-Seed-Code 模型进行了本次重构。

第一步:目标确认

原系统需要先打开网页随便选一个小宇宙的播客链接,输入进 HearSight 的输入框,然后提交到后端,我们可以看到前端这边开始的时候是只能支持 bilibili 的视频链接进行导入,我们没法输出小宇宙播客链接的内容提交到后端里面。所以改造目标很明确:

第二步:结果验证

经过与 Doubao-Seed-Code 的多轮协作和代码修改后,HearSight 成功实现了对小宇宙播客链接的导入。前端能正常显示进度条,整个流程与旧系统效果几乎一致。

之前很多朋友在谈论到 AI 编程的时候就经常说 AI 一天天的尽给我们搞破坏,写着写着原有功能就没了,更糟糕的事,新的功能也没实现。

说实话我自己就遇到过挺多次类似的情况,万幸的是我一般都会有使用git commit保存最新的版本,方便我回滚项目功能,并重新进行开发。

这次的 AI 辅助开发过程中令我感到比较惊喜的是 ,Doubao-Seed-Code 没有将原有的已有功能破坏。小到下载的进度条返回,大到文稿的转换和总结功能,在集成新代码后全部保持了正常的运行状态。

Agentic Coding 的协作经验

本次重构的成功,很大程度上得益于 Doubao-Seed-Code 的长上下文能力,以及一套我自己沉淀下来的行之有效的 AI 编程协作方法论——即遵循“阅读先行,编辑授权”的核心原则。

第一步:阅读先行——用对话式讨论进行上下文构建

在启动任务时,我采取了对话式讨论的策略,没有直接给出修改指令,而是先让模型阅读相关的后端文件,并询问它们之间的差异,来逐步建立有效的上下文:

即使模型的第一次回答不够精准,第二次重新补充信息之后立马就能表达出来我所想要表达的意思,模型也能迅速矫正,立马理解了任务的核心意图。

这里可以看出 Doubao-Seed-Code 在指令遵循方面的能力做的不错,对于表达能力稍微欠缺的小伙伴,会挺有帮助。

我还发现在这个文件阅读的过程中,Doubao-Seed-Code 的 Agentic 能力有不错的表现,主要体现在主动感知与文件反哺方面。

举个例子,当接收并分析完我提供的目标文件后,Doubao-Seed-Code 主动发现了另一个与本次任务高度相关的文件——即负责封装下载服务的进度条功能文件download_service.py

估计是 Doubao-Seed-Code 能够通过文件名关联或模块导入关系,顺藤摸瓜找到完整的代码执行路径,避免了由于人工遗漏相关文件而导致的上下文残缺确保后续代码修改操作的完整性和可行性。

Doubao-Seed-Code 读取了py文件之后,又找到了几个相关的文件,考虑到当前仍有宽裕的上下文空间,我选择继续让它加载这些相关文件,可以让继续了解相关的信息方便他进行进一步的代码编辑。

通过多次提供上下文相关文件内容,我们已成功地让 Doubao-Seed-Code 掌握了文件下载的后端链路信息。此时我发现,模型在读取完了后端所有需要修改的文件内容后,还提到想要进一步了解前端的内容。

不过我觉得可以先不用让 Doubao-Seed-Code 读取前端的内容,虽然Doubao-Seed-Code 具有256k的上下文,对比其他的128k上下文的模型已经多出了一倍,但是过于多的相关信息,会导致信息密度降低,从而导致系统的重构出现意外。只有有效的代码信息进入上下文,才能避免不必要的信息污染。

我必须尽量保证 Doubao-Seed-Code 重构后端的成功率,那么上下文信息提供到这里,就可以进一步让 Doubao-Seed-Code 开始对代码进行编辑了。

第二步:编辑授权——开发者审核策略,AI 执行

在上下文建立完毕后,就进入了授权编辑的阶段。在开始编辑之前,我提供了详细的编程偏好说明,并要求模型先列出修改计划(TODO List)进行审核。这属于 AI 编程中的中间授权层级,即开发者审核策略,AI 执行。

为什么我会先让 Doubao-Seed-Code 生成计划大纲,审核之后才决定是否允许它进行编辑呢?

这其实可以用管理学中的授权层次来解释:

在 AI 编程场景中,我给予 AI 的正是中间层级授权。因为就纯编程能力而言,AI 已经非常强大;但结合具体项目背景,它仍然不及我们人类全面。当然,如果控制AI的人本身不懂相关的技术,那么可能只能选择最高层级授权了,疑 AI 不用,用 AI 不疑。

正式进入编辑阶段后,模型始终清晰地记着我的要求,包括“单个文件的代码量不要超过 300 行”等代码规范偏好。

这在多轮复杂的后端开发任务中十分难得。得益于Doubao-Seed-Code 有着 256K 的长上下文,它能够持续保持这种细节化的规范记忆,减少 AI 在开发中“写着写着就忘记了规范”的常见问题。

在前端文件修改中,Doubao-Seed-Code 展现出更高的自动化与整体思维:不会“改一处,思考一下,再改下一处”,而是表现出像 Cursor 或 Copilot 这类深度集成工具的特点——能一次性编辑多个文件中的多个位置,然后统一汇报结果。

在我以往的测试中,不少模型在终端接入时的执行方式是串行且割裂的。相比之下,Doubao-Seed-Code 的修改行为会更加连贯高效——能一次性完成多处同步修改,有时候甚至能一次修改五处内容。这种高效率的批处理式的编辑能力,正是 Agentic 能力更强的体现,显著提升了跨文件重构的效率。

成本评估:一杯瑞幸咖啡

任务完成了,我习惯性地会复盘一下工具的成本。

我看了下它在火山方舟上的定价,目前开发者有两种选择:

一种是 Coding Plan。Lite 套餐首购首月是 9.9 元,我用的就是这个,点击文末的阅读原文可以查看。

另一种是按量付费的 API 调用。这对用量不固定,或者想集成到自己工具流的开发者来说更加友好。在最常用的 0–32k 区间,输入仅为 1.20 元/百万 Tokens。

这次项目重构中,我一共使用了七百多万 Tokens,调用了 171 次,全都被 Coding Plan 的 Lite 套餐覆盖了,花费差不多一杯瑞幸的价格。

整体体验下来,Doubao-Seed-Code 的 Agentic 规划能力和 256K 超长上下文带来了比较大的帮助。它不再只是一个代码助手,而成为了理解系统结构、能自主规划并验证跨越代码边界修改的 Agentic Coder。

在日常开发中有编程需求的,可以上手体验起来。

附9.9元地址。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 编程 Doubao-Seed-Code Agentic Coding 长上下文 开源项目 HearSight 火山引擎 代码重构 AI 辅助开发 AI Programming Long Context Open Source Project Code Refactoring AI Assisted Development
相关文章