AI结对编程实战：打造智能文章知识库全记录（附9条心得）

ShawnXie2026/1/23大约 9 分钟

AI结对编程实战：打造智能文章知识库全记录（附9条心得）

在《肖恩技术周刊25年总结》的来年规划中有一项是提升周刊的全流程自动化。终极目标是让个人只聚焦于阅读和笔记，剩下的交给工具，让它自己“写”出一篇周刊。

但若纯靠自己撸代码实现工具，虽然也能完成，但成本会高很多。一方面技术栈不熟，先学再写，时间成本过高；另一方面，日常事务繁忙，根本无法抽出整块时间进行沉浸式编程。

于是，我自然就想到了和AI结对编程。既能满足需求，又能借此深入了解市面上的各种AI编程工具，完成对AI编程的探索，可谓一举两得。

事不宜迟，说干就干！

PS：嫌“太长不看”的朋友可直接跳到总结部分。

前置说明

分工

我：提出诉求、把控整体进度并验收最终结果
AI：完成技术方案设计、代码实现和功能测试

工具

AI编程工具使用了Trae和OpenCode，大模型是GLM-4.7。

为什么是这个组合？当然是因为没钱上Claude啦！而且暂时也不算AI编程重度用户，相比于实现能力，现在更缺乏产品创意。选择的这两个工具也都是最流行编程工具的平替，通过他们来学习再合适不过（白嫖万岁）。

本次开发前期使用了Trae完成了技术方案和初版代码实现，之后使用OpenCode进行功能完善和验证等。

考虑到部分读者可能第一次使用AI编程工具，这里简单介绍下。

Trae（类Cursor）

TRAE 是字节跳动推出的一款 AI IDE，本质上可以看作“AI 开发工程师”，深度融合大模型能力，帮助开发者大幅提升编码效率。特色有：

长期免费使用顶级模型
中文理解 & 交互体验明显更强
SOLO 模式自动化程度很高，从需求 → 规划 → 写代码 → 测试 → 修复 → 预览 → 部署
工具调用 & 自定义智能体生态开放度很高
同时保留 IDE 控制感 + Agent 全自动两种极端玩法，灵活性极强

OpenCode（类ClaudeCode）

OpenCode 是开源的类 ClaudeCode 工具，以终端优先设计为核心，目前是最受欢迎的开源 AI 编程工具之一。特色有：

100% 开源
不绑定模型、不锁死，可随时切换最强/最便宜模型
终端原生体验，延迟极低、上下文完整、不用频繁切窗口
支持Plan/Build 模式
对国内用户友好，无封号/限速焦虑，支持大量国产模型

Oh-My-Opencode（OpenCode插件）

提到OpenCode就绕不开插件Oh-My-Opencode，是目前最受欢迎、最活跃的第三方插件。本质上是一个智能体编排框架，大幅强化了原生的 OpenCode。其内置了符合AI编程实践的常用Agent：

Sisyphus（主智能体）：扮演“技术 Leader”角色（一般使用 Opus 4.5 High 等强模型）
Oracle：架构师、调试大神（一般使用 GPT 5.2 Medium）
Frontend UI/UX Engineer：前端与设计专家（一般使用 Gemini 3 Pro）
Librarian：翻阅文档、查开源实现、代码库探索（Claude Sonnet 4.5）
Debugger / Tester / Architect 等（可扩展）

也实现了完整的 Claude Code 兼容，支持Command、Agent、Skill、MCP、Hook等技术。是不想花钱又想体验CC编程感受的最佳选择！

GLM-4.7

智谱AI发布的最新一代旗舰大模型，定位为开源模型中的顶级选手，尤其在编程和Agent能力上表现突出。当然并不是能力强的原因选择了它，而是Trae和OpenCode里能免费使用，哈哈。

需求梳理

即便与AI组队，需求仍需从自身核心诉求出发，因此如何准确地描述出需求是第一步。

相较于在编程过程中逐步探索产品最终形态的方式，我更倾向于在前期投入更多精力进行调研和分析，明确产品方向与核心功能后再着手实施。

那么，AI能在需求梳理这种场景中起到什么作用呢？

业界调研：帮助我快速了解当前技术趋势与相关工具，辅助完成技术选型；
功能完善：在我提出原始需求后，通过与AI的多次交互讨论，逐步完善和优化功能；
方案撰写：基于完善后的需求输出详细方案。（AI在文本书写方面真的很擅长！）

下面是我写的初始需求描述（和最终实现有一些差异）：

## 采集入口
浏览器插件/网页作为入口，接收网页url
## 核心能力
- 抓取文章内容：将文章正文和图片完整的抓取并保存，剔除无关的内容
- 翻译：对于英文文章自动翻译，但在展示时默认展示原文，提供切换按钮
- AI解析：基于配置生成文章摘要、大纲、关键信息和思维导图等
- 导出：选定时间范围、类型导出Markdown格式文本，按照分类排版，文章内容包含标题、头图、摘要、大纲、关键信息等（可配置）
## 产品形态
网页web应用，拥有展示端和控制端。
### 展示端
- 主页：文章feed流列表，支持筛选和分页
  - 筛选：时间、类型、来源等筛选
  - 文章项：包含标题、作者、分类、发布时间、头图和摘要等核心信息
  - 删除：登录后支持删除文章
- 文章详情页：
  - 左侧：展示原始文章信息，包含标题、作者、分类、正文等
  - 右侧：展示AI提供的额外信息解读，包含：摘要、大纲、关键信息和思维导图
  - 重新生成：登录后支持不同AI解读内容的重新生成
### 控制端
admin后台，支持简单的登录验证，提供各种配置能力，包含
- 标签：支持新增、编辑、删除分类标签
- 大模型：API接入相关配置
- AI解析：
  - 范围配置：可针对文章分类或单篇文章设置
  - 维度配置：摘要、大纲、关键信息和思维导图
    - 配置项包含：是否开启、提示词、使用模型等
- 导出：文章内容包含选择，勾选（标题、头图、信息图、摘要）

成果先行

先展示下MVP版本，虽然功能还比较基础，但整体完成度还不错，已经具备了核心功能。

文章采集插件

文章知识库后台

实现过程

技术方案

核心思路：让AI扮演专业的架构设计师，根据需求描述输出详细的技术方案。

定义智能体

通过“智能生成”方式只需要简单描述需求即可，不用写特别复杂的提示词，AI会自动优化。

如果想使用这个智能体，可点击 https://s.trae.com.cn/a/da22eb?region=cn 一键复刻到TRAE使用（注意是国内版）。

生成技术方案

使用智能体生成方案 → 人工确认并提出优化诉求 → 智能体优化方案 → 重复以上步骤直到满意。

省略迭代交互，最后AI给的架构图如下：

编码实现

核心思路：让AI首先生成MVP版本，然后在该版本基础上持续迭代直至符合预期。

实现MVP

步骤一：使用“架构设计专家”智能体将方案裁剪为MVP版本，过程和生成方案类似

步骤二：使用SOLO Coder模式实现MVP版本

建议开启Plan，模型会优先规划，用户确认后再执行，可以有效减少生成代码不符合预期的情况。

TRAE的执行计划会保存到.trae/documents下，这种处理方式非常实用，既方便人工审查，也便于在切换任务后读取。

之后就是等待智能体完成代码编写。当然AI声称的完成状态大概率是不可信的，通常无法正常运行或遗漏了部分功能实现，但至少完成了整个项目的骨架，这样我们就进入迭代完善环节了。

迭代完善

从这里开始切换为OpenCode，因为在迭代阶段遇到一个TRAE一直无法解决的问题，尝试换个工具试试。

核心思路：step by step，每次交互只解决少量问题，解决后进行功能验收（CI/CD），符合预期提交代码后再进行下次交互。

步骤一：提迭代需求

步骤二：部署并验收结果

步骤三：使用AI生成git commit内容并提交代码

重复步骤...直到解决完所有迭代诉求。

结语

本次核心目的是全流程深度体验AI编程，实操了一些前沿的工具。从结果来看，AI结对编程的效果还是很好的，至少我快速得到了一个可运行的玩具。但实际上让AI做到这个效果也并不容易，仍有很多使用技巧和注意事项，这些经验都凝练成了下面9条心得，将在后续的实践中持续验证。

定义专属的Agent（AI版专人专事），但不要手动优化提示词，通过描述诉求让AI生成和优化
结合Spec编程思路，在编程前制定清晰的计划
优先实现MVP版本，因为如果一次性实现所有功能，效果不一定好，验证的难度也很大
迭代开发时最好step by step，把工作分解成小的、迭代式的任务，不仅能让AI更聚焦，也方便自己验收结果
提供详尽的背景信息和指导（生成Agent.md、保留执行计划等），LLM的效果取决于上下文的丰富程度，在任务切换时AI也能更快掌握现状
考虑上下文使用50%以上时主动切换任务，避免AI因为上下文过长而遗忘信息，让其始终聚焦于解决核心问题
人在回路（Human in the loop），一定要核实、测试和审查所有内容
使用Git进行版本管理并经常提交代码，按小迭代推进（需求 -> 开发 -> 验证 -> 提交），方便不符合预期时回滚。并用AI生成git commit信息，能快速生成改动摘要，便于理解具体的改动点
相信AI，持续学习和适应新的编程模式

回到应用本身，目前还不够成熟，需要进一步优化和完善。如果你期待这个工具，可以给这篇文章点个赞，这样我就能感知到并加快迭代推出正式版😁，当然代码也会开源到Github。