在过去两年,大家谈到AI×编程时,更多看到的是Greenfield场景:“从零开始做一个项目,用AI帮你生成代码。”但真实世界几乎从不这么理想。企业内部真正耗钱、耗人、耗时间的是:一层又一层的旧系统缺失或混乱的文档历史包袱堆叠的架构业务逻辑隐式分散在代码与人的记忆里
在过去两年,大家谈到 AI × 编程时,更多看到的是 Greenfield 场景:
“从零开始做一个项目,用 AI 帮你生成代码。”
但真实世界几乎从不这么理想。 企业内部真正耗钱、耗人、耗时间的是:
这才是 Brownfield(棕地工程) —— 在现有系统上继续施工、翻新、扩展、改造、排雷。
2025 年末,这篇论文 Beyond Greenfield 做了一件有意义的事:
它第一次系统地研究 生成式 AI 对 Brownfield 工程的帮助,并提出一个具备可操作性的工作方法论:
D3 流程:Discover → Define → Deliver 用结构化方式让 LLM 参与遗留系统的理解、文档重建与重构。

下面,我们将从“它为什么重要”“它具体做了什么”“它的发现”“它的局限”四个维度进行深入浅出的分析。
之前关于 LLM 的研究,多在“理想化任务”上测试:
但是企业世界是:
70% 的人力都花在维护、理解、重构、补文档!
论文开宗明义指出:遗留系统才是真正的主战场,但缺乏系统研究。
论文不是讨论“AI 能不能写代码”,而是提出了一种可落地的方法 —— D3 框架。
目标:让 AI 协助工程师快速“读懂系统”。
包括:
这里的关键点是:
AI 不负责判断,而负责“把散落的知识提炼成结构化线索”。
工程师则像侦探一样,用这些线索建立系统的“心智模型(mental model)”。
当 Discover 阶段让系统“变清晰”后,Define 阶段做的是:
这个阶段是论文认为 AI 最强 的环节: AI 能自动把“隐性知识”变成“显性文档”。
用人类语言重新描述系统,能让团队更快达成共识。
有了清晰文档和可行架构方案,AI 才帮助你真正写代码:
论文强调:这个阶段仍要 强监督,因为遗留系统里有太多边界情况、特殊业务、老旧 hack —— AI 无法自动完全理解。
论文提出一个非常有价值的设计:
每一次 AI 输出,都必须经过第二个 AI 审查。
角色如下:
好处:
这其实是一种“AI 内部 pair programming”。
52 位工程师的真实使用反馈
论文做了一项 survey + 真实任务试用研究,结果来自工程师自我报告:
在遗留系统工程里,这是非常高的数字。
当文档缺失、架构不清时,最伤的就是脑力消耗。
说明 AI 自动生成的文档质量可用,不再像以前那样“要重写”。
工程师不再迷失在 spaghetti code 里。
但论文也清楚指出: 这些结果是 主观 的,还不是严格实验。
这篇论文其实在告诉我们:
而是帮助你 理解系统。
但它能让工程师少走很多弯路。
而是历史欠账、知识没沉淀、文档不一致。
AI 适合做的刚好就是:
把“大量散乱的信息”整理成结构化知识。
换句话说,它揭示了一个方向,但不是最终答案。
这篇论文最重要的贡献不是证明 AI 多厉害,而是提出了一种“结构化地使用 AI”来处理遗留系统的方法。
它推动了行业从 “AI 自动写代码”转向“AI 参与文档、架构、认知梳理、重构辅助的系统工程流派”。
对现实世界开发者来说,它的价值是:
✔ 给你一个真正可用的框架(D3)
✔ 帮你把遗留系统从混乱变得可解释
✔ 用双 AI 机制提高结果质量
✔ 显著减少阅读旧代码和补文档的痛苦
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!