AI结对编程实战:打造智能文章知识库全记录(附9条心得)
AI结对编程实战:打造智能文章知识库全记录(附9条心得)

在《肖恩技术周刊25年总结》的来年规划中有一项是提升周刊的全流程自动化。终极目标是让个人只聚焦于阅读和笔记,剩下的交给工具,让它自己“写”出一篇周刊。
但若纯靠自己撸代码实现工具,虽然也能完成,但成本会高很多。一方面技术栈不熟,先学再写,时间成本过高;另一方面,日常事务繁忙,根本无法抽出整块时间进行沉浸式编程。
于是,我自然就想到了和AI结对编程。既能满足需求,又能借此深入了解市面上的各种AI编程工具,完成对AI编程的探索,可谓一举两得。
事不宜迟,说干就干!
PS:嫌“太长不看”的朋友可直接跳到总结部分。
前置说明
分工
- 我:提出诉求、把控整体进度并验收最终结果
- AI:完成技术方案设计、代码实现和功能测试
工具
AI编程工具使用了Trae和OpenCode,大模型是GLM-4.7。
为什么是这个组合?当然是因为没钱上Claude啦!而且暂时也不算AI编程重度用户,相比于实现能力,现在更缺乏产品创意。选择的这两个工具也都是最流行编程工具的平替,通过他们来学习再合适不过(白嫖万岁)。
本次开发前期使用了Trae完成了技术方案和初版代码实现,之后使用OpenCode进行功能完善和验证等。
考虑到部分读者可能第一次使用AI编程工具,这里简单介绍下。
Trae(类Cursor)
TRAE 是字节跳动推出的一款 AI IDE,本质上可以看作“AI 开发工程师”,深度融合大模型能力,帮助开发者大幅提升编码效率。特色有:
- 长期免费使用顶级模型
- 中文理解 & 交互体验明显更强
- SOLO 模式自动化程度很高,从需求 → 规划 → 写代码 → 测试 → 修复 → 预览 → 部署
- 工具调用 & 自定义智能体生态开放度很高
- 同时保留 IDE 控制感 + Agent 全自动两种极端玩法,灵活性极强

OpenCode(类ClaudeCode)
OpenCode 是开源的类 ClaudeCode 工具,以终端优先设计为核心,目前是最受欢迎的开源 AI 编程工具之一。特色有:
- 100% 开源
- 不绑定模型、不锁死,可随时切换最强/最便宜模型
- 终端原生体验,延迟极低、上下文完整、不用频繁切窗口
- 支持Plan/Build 模式
- 对国内用户友好,无封号/限速焦虑,支持大量国产模型

Oh-My-Opencode(OpenCode插件)
提到OpenCode就绕不开插件Oh-My-Opencode,是目前最受欢迎、最活跃的第三方插件。本质上是一个智能体编排框架,大幅强化了原生的 OpenCode。其内置了符合AI编程实践的常用Agent:
- Sisyphus(主智能体):扮演“技术 Leader”角色 (一般使用 Opus 4.5 High 等强模型)
- Oracle:架构师、调试大神(一般使用 GPT 5.2 Medium)
- Frontend UI/UX Engineer:前端与设计专家(一般使用 Gemini 3 Pro)
- Librarian:翻阅文档、查开源实现、代码库探索(Claude Sonnet 4.5)
- Debugger / Tester / Architect 等(可扩展)
也实现了完整的 Claude Code 兼容,支持Command、Agent、Skill、MCP、Hook等技术。是不想花钱又想体验CC编程感受的最佳选择!

GLM-4.7
智谱AI发布的最新一代旗舰大模型,定位为开源模型中的顶级选手,尤其在编程和Agent能力上表现突出。当然并不是能力强的原因选择了它,而是Trae和OpenCode里能免费使用,哈哈。

需求梳理
即便与AI组队,需求仍需从自身核心诉求出发,因此如何准确地描述出需求是第一步。
相较于在编程过程中逐步探索产品最终形态的方式,我更倾向于在前期投入更多精力进行调研和分析,明确产品方向与核心功能后再着手实施。
那么,AI能在需求梳理这种场景中起到什么作用呢?
- 业界调研:帮助我快速了解当前技术趋势与相关工具,辅助完成技术选型;
- 功能完善:在我提出原始需求后,通过与AI的多次交互讨论,逐步完善和优化功能;
- 方案撰写:基于完善后的需求输出详细方案。(AI在文本书写方面真的很擅长!)
下面是我写的初始需求描述(和最终实现有一些差异):
## 采集入口
浏览器插件/网页作为入口,接收网页url
## 核心能力
- 抓取文章内容:将文章正文和图片完整的抓取并保存,剔除无关的内容
- 翻译:对于英文文章自动翻译,但在展示时默认展示原文,提供切换按钮
- AI解析:基于配置生成文章摘要、大纲、关键信息和思维导图等
- 导出:选定时间范围、类型导出Markdown格式文本,按照分类排版,文章内容包含标题、头图、摘要、大纲、关键信息等(可配置)
## 产品形态
网页web应用,拥有展示端和控制端。
### 展示端
- 主页:文章feed流列表,支持筛选和分页
- 筛选:时间、类型、来源等筛选
- 文章项:包含标题、作者、分类、发布时间、头图和摘要等核心信息
- 删除:登录后支持删除文章
- 文章详情页:
- 左侧:展示原始文章信息,包含标题、作者、分类、正文等
- 右侧:展示AI提供的额外信息解读,包含:摘要、大纲、关键信息和思维导图
- 重新生成:登录后支持不同AI解读内容的重新生成
### 控制端
admin后台,支持简单的登录验证,提供各种配置能力,包含
- 标签:支持新增、编辑、删除分类标签
- 大模型:API接入相关配置
- AI解析:
- 范围配置:可针对文章分类或单篇文章设置
- 维度配置:摘要、大纲、关键信息和思维导图
- 配置项包含:是否开启、提示词、使用模型等
- 导出:文章内容包含选择,勾选(标题、头图、信息图、摘要)成果先行
先展示下MVP版本,虽然功能还比较基础,但整体完成度还不错,已经具备了核心功能。
文章采集插件

文章知识库后台

实现过程
技术方案
核心思路:让AI扮演专业的架构设计师,根据需求描述输出详细的技术方案。
定义智能体
通过“智能生成”方式只需要简单描述需求即可,不用写特别复杂的提示词,AI会自动优化。

如果想使用这个智能体,可点击 https://s.trae.com.cn/a/da22eb?region=cn 一键复刻到TRAE使用(注意是国内版)。
生成技术方案
使用智能体生成方案 → 人工确认并提出优化诉求 → 智能体优化方案 → 重复以上步骤直到满意。


省略迭代交互,最后AI给的架构图如下:

编码实现
核心思路:让AI首先生成MVP版本,然后在该版本基础上持续迭代直至符合预期。
实现MVP
- 步骤一:使用“架构设计专家”智能体将方案裁剪为MVP版本,过程和生成方案类似

- 步骤二:使用
SOLO Coder模式实现MVP版本

建议开启Plan,模型会优先规划,用户确认后再执行,可以有效减少生成代码不符合预期的情况。

TRAE的执行计划会保存到.trae/documents下,这种处理方式非常实用,既方便人工审查,也便于在切换任务后读取。

之后就是等待智能体完成代码编写。当然AI声称的完成状态大概率是不可信的,通常无法正常运行或遗漏了部分功能实现,但至少完成了整个项目的骨架,这样我们就进入迭代完善环节了。

迭代完善
从这里开始切换为OpenCode,因为在迭代阶段遇到一个TRAE一直无法解决的问题,尝试换个工具试试。
核心思路:step by step,每次交互只解决少量问题,解决后进行功能验收(CI/CD),符合预期提交代码后再进行下次交互。
- 步骤一:提迭代需求


- 步骤二:部署并验收结果

- 步骤三:使用AI生成
git commit内容并提交代码


重复步骤...直到解决完所有迭代诉求。
结语
本次核心目的是全流程深度体验AI编程,实操了一些前沿的工具。从结果来看,AI结对编程的效果还是很好的,至少我快速得到了一个可运行的玩具。但实际上让AI做到这个效果也并不容易,仍有很多使用技巧和注意事项,这些经验都凝练成了下面9条心得,将在后续的实践中持续验证。
- 定义专属的Agent(AI版专人专事),但不要手动优化提示词,通过描述诉求让AI生成和优化
- 结合Spec编程思路,在编程前制定清晰的计划
- 优先实现MVP版本,因为如果一次性实现所有功能,效果不一定好,验证的难度也很大
- 迭代开发时最好step by step,把工作分解成小的、迭代式的任务,不仅能让AI更聚焦,也方便自己验收结果
- 提供详尽的背景信息和指导(生成Agent.md、保留执行计划等),LLM的效果取决于上下文的丰富程度,在任务切换时AI也能更快掌握现状
- 考虑上下文使用50%以上时主动切换任务,避免AI因为上下文过长而遗忘信息,让其始终聚焦于解决核心问题
- 人在回路(Human in the loop),一定要核实、测试和审查所有内容
- 使用Git进行版本管理并经常提交代码,按小迭代推进(需求 -> 开发 -> 验证 -> 提交),方便不符合预期时回滚。并用AI生成git commit信息,能快速生成改动摘要,便于理解具体的改动点
- 相信AI,持续学习和适应新的编程模式
回到应用本身,目前还不够成熟,需要进一步优化和完善。如果你期待这个工具,可以给这篇文章点个赞,这样我就能感知到并加快迭代推出正式版😁,当然代码也会开源到Github。
