Datawhale 11月12日 23:56
AI 辅助开源项目重构:Doubao-Seed-Code 的实践经验
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文作者分享了使用火山引擎豆包编程模型 Doubao-Seed-Code 辅助开源项目 HearSight 进行多源内容导入重构的实践经验。作者详细介绍了如何利用 Doubao-Seed-Code 的 256K 长上下文和 Agentic Coding 能力,通过“阅读先行,编辑授权”的方法论,成功实现了对小宇宙播客、YouTube 等平台内容的支持,同时保留了原有功能。作者特别强调了模型在主动感知相关文件、多文件协同编辑以及遵循代码规范方面的优势,并对使用成本进行了评估,认为其性价比高,能够成为理解系统结构、自主规划代码修改的智能编程助手。

🚀 **AI 辅助开发提升效率与准确性**:作者通过开源项目 HearSight 的重构实践,展示了 AI 编程模型 Doubao-Seed-Code 如何有效解决多模块协同开发中的复杂性问题。通过利用其 256K 的超长上下文和 Agentic Coding 能力,成功实现了对小宇宙播客、YouTube 等平台内容导入的支持,同时确保了原有功能的完整性,显著降低了开发和测试成本。

💡 **“阅读先行,编辑授权”协作方法论**:文章提出了一套行之有效的 AI 编程协作方法论。首先通过对话式讨论让模型“阅读先行”,逐步构建上下文,模型能主动感知并反哺相关文件信息。随后进入“编辑授权”阶段,通过要求模型生成修改计划(TODO List)并由开发者审核,实现中间层级的授权,确保 AI 在理解项目背景和遵循指令方面的准确性。

🧠 **Agentic 能力与长上下文优势**:Doubao-Seed-Code 的 Agentic 能力在本次重构中表现突出,体现在主动感知相关文件(如 download_service.py)、多文件协同编辑以及批处理式修改。256K 的长上下文使其能够持久记忆编程偏好和代码规范,避免了 AI 在开发过程中遗忘细节的问题,显著提升了跨文件重构的效率和连贯性。

💰 **高性价比的成本效益**:作者对 Doubao-Seed-Code 的使用成本进行了评估,通过火山方舟的 Coding Plan Lite 套餐,花费相当于一杯瑞幸咖啡的价格,即可完成大规模的代码重构任务。这表明 AI 辅助编程在提供强大功能的同时,也具备了良好的经济效益,适合开发者日常使用。

原创 筱可 2025-11-12 20:44 浙江

 Datawhale干货 

作者:筱可,Datawhale成员

实测项目背景

我有一个维护中的开源项目 HearSight——一个基于 AI 的视频辅助阅读工具:https://github.com/li-xiu-qi/HearSight

最近项目新的需求是:希望支持多源内容导入——不仅仅是 Bilibili,还要能从小宇宙播客、YouTube 等平台导入内容。

这类改造虽然代码不复杂,但涉及前后端多模块协同,任何一次改动都必须同时协调两端。如果其中一端实现有误,测试和回溯的成本就会比较高。这种息量大、系统复杂,人脑无法同时 hold 住所有上下文的情况就很适合使用AI来协助编程。

所以我用了火山引擎新发布的豆包编程模型 Doubao-Seed-Code,主打 Agentic Coding 优化,并提供 256K 的原生长上下文,契合我这种复杂、跨文件的修改任务。

从公开测评结果来看,在Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands等主流测评集中,Doubao-Seed-Code 表现出色,仅次于Claude Sonnet 4.5。

使用Doubao-Seed-Code模型

我使用火山引擎的 veCLI 终端搭配 Doubao-Seed-Code 模型进行了本次重构。

第一步:目标确认

原系统需要先打开网页随便选一个小宇宙的播客链接,输入进 HearSight 的输入框,然后提交到后端,我们可以看到前端这边开始的时候是只能支持 bilibili 的视频链接进行导入,我们没法输出小宇宙播客链接的内容提交到后端里面。所以改造目标很明确:

后端: 重构媒体文件下载功能,支持小宇宙、Bilibili 和 YouTube。

前端: 修改链接提交逻辑,放开对小宇宙、Bilibili 和 YouTube 链接的限制。

第二步:结果验证

经过与 Doubao-Seed-Code 的多轮协作和代码修改后,HearSight 成功实现了对小宇宙播客链接的导入。前端能正常显示进度条,整个流程与旧系统效果几乎一致。

之前很多朋友在谈论到 AI 编程的时候就经常说 AI 一天天的尽给我们搞破坏,写着写着原有功能就没了,更糟糕的事,新的功能也没实现。

说实话我自己就遇到过挺多次类似的情况,万幸的是我一般都会有使用git commit保存最新的版本,方便我回滚项目功能,并重新进行开发。

这次的 AI 辅助开发过程中令我感到比较惊喜的是 ,Doubao-Seed-Code 没有将原有的已有功能破坏。小到下载的进度条返回,大到文稿的转换和总结功能,在集成新代码后全部保持了正常的运行状态。

Agentic Coding 的协作经验

本次重构的成功,很大程度上得益于 Doubao-Seed-Code 的长上下文能力,以及一套我自己沉淀下来的行之有效的 AI 编程协作方法论——即遵循“阅读先行,编辑授权”的核心原则。

第一步:阅读先行——用对话式讨论进行上下文构建

在启动任务时,我采取了对话式讨论的策略,没有直接给出修改指令,而是先让模型阅读相关的后端文件,并询问它们之间的差异,来逐步建立有效的上下文:

即使模型的第一次回答不够精准,第二次重新补充信息之后立马就能表达出来我所想要表达的意思,模型也能迅速矫正,立马理解了任务的核心意图。

这里可以看出 Doubao-Seed-Code 在指令遵循方面的能力做的不错,对于表达能力稍微欠缺的小伙伴,会挺有帮助。

我还发现在这个文件阅读的过程中,Doubao-Seed-Code 的 Agentic 能力有不错的表现,主要体现在主动感知与文件反哺方面。

举个例子,当接收并分析完我提供的目标文件后,Doubao-Seed-Code 主动发现了另一个与本次任务高度相关的文件——即负责封装下载服务的进度条功能文件download_service.py

估计是 Doubao-Seed-Code 能够通过文件名关联或模块导入关系,顺藤摸瓜找到完整的代码执行路径,避免了由于人工遗漏相关文件而导致的上下文残缺确保后续代码修改操作的完整性和可行性。

Doubao-Seed-Code 读取了py文件之后,又找到了几个相关的文件,考虑到当前仍有宽裕的上下文空间,我选择继续让它加载这些相关文件,可以让继续了解相关的信息方便他进行进一步的代码编辑。

通过多次提供上下文相关文件内容,我们已成功地让 Doubao-Seed-Code 掌握了文件下载的后端链路信息。此时我发现,模型在读取完了后端所有需要修改的文件内容后,还提到想要进一步了解前端的内容。

不过我觉得可以先不用让 Doubao-Seed-Code 读取前端的内容,虽然Doubao-Seed-Code 具有256k的上下文,对比其他的128k上下文的模型已经多出了一倍,但是过于多的相关信息,会导致信息密度降低,从而导致系统的重构出现意外。只有有效的代码信息进入上下文,才能避免不必要的信息污染。

我必须尽量保证 Doubao-Seed-Code 重构后端的成功率,那么上下文信息提供到这里,就可以进一步让 Doubao-Seed-Code 开始对代码进行编辑了。

第二步:编辑授权——开发者审核策略,AI 执行

在上下文建立完毕后,就进入了授权编辑的阶段。在开始编辑之前,我提供了详细的编程偏好说明,并要求模型先列出修改计划(TODO List)进行审核。这属于 AI 编程中的中间授权层级,即开发者审核策略,AI 执行。

为什么我会先让 Doubao-Seed-Code 生成计划大纲,审核之后才决定是否允许它进行编辑呢?

这其实可以用管理学中的授权层次来解释:

最低层次:员工只带着问题来找你,等着你给出策略,他只负责执行。

中间层次:员工不仅提出问题,还带上几套解决方案,由你判断哪一种可行。这已经体现出主动性与思考力。

最高层次:你只需告知目标,员工便能独立完成,甚至无需汇报过程。

在 AI 编程场景中,我给予 AI 的正是中间层级授权。因为就纯编程能力而言,AI 已经非常强大;但结合具体项目背景,它仍然不及我们人类全面。当然,如果控制AI的人本身不懂相关的技术,那么可能只能选择最高层级授权了,疑 AI 不用,用 AI 不疑。

正式进入编辑阶段后,模型始终清晰地记着我的要求,包括“单个文件的代码量不要超过 300 行”等代码规范偏好。

这在多轮复杂的后端开发任务中十分难得。得益于Doubao-Seed-Code 有着 256K 的长上下文,它能够持续保持这种细节化的规范记忆,减少 AI 在开发中“写着写着就忘记了规范”的常见问题。

在前端文件修改中,Doubao-Seed-Code 展现出更高的自动化与整体思维:不会“改一处,思考一下,再改下一处”,而是表现出像 Cursor 或 Copilot 这类深度集成工具的特点——能一次性编辑多个文件中的多个位置,然后统一汇报结果。

在我以往的测试中,不少模型在终端接入时的执行方式是串行且割裂的。相比之下,Doubao-Seed-Code 的修改行为会更加连贯高效——能一次性完成多处同步修改,有时候甚至能一次修改五处内容。这种高效率的批处理式的编辑能力,正是 Agentic 能力更强的体现,显著提升了跨文件重构的效率。

成本评估:一杯瑞幸咖啡

任务完成了,我习惯性地会复盘一下工具的成本。

我看了下它在火山方舟上的定价,目前开发者有两种选择:

一种是 Coding Plan。Lite 套餐首购首月是 9.9 元,我用的就是这个,点击文末的阅读原文可以查看。

另一种是按量付费的 API 调用。这对用量不固定,或者想集成到自己工具流的开发者来说更加友好。在最常用的 0–32k 区间,输入仅为 1.20 元/百万 Tokens。

这次项目重构中,我一共使用了七百多万 Tokens,调用了 171 次,全都被 Coding Plan 的 Lite 套餐覆盖了,花费差不多一杯瑞幸的价格。

整体体验下来,Doubao-Seed-Code 的 Agentic 规划能力和 256K 超长上下文带来了比较大的帮助。它不再只是一个代码助手,而成为了理解系统结构、能自主规划并验证跨越代码边界修改的 Agentic Coder。

在日常开发中有编程需求的,可以上手体验起来。

图片

附9.9元地址。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI编程 Doubao-Seed-Code 火山引擎 开源项目 Agentic Coding 长上下文 代码重构 HearSight AI Development Volcanic Engine Open Source Long Context Code Refactoring
相关文章