告别手动优化提示,构建可复用的AI工作流

leopardracer 发布于 2026-06-20 阅读 43

本文介绍了如何将AI提示转化为可复用工作流的方法,旨在解决手动复制粘贴和上下文丢失的低效问题。作者指出,当提示习惯无法扩展时,说明遇到了架构问题。通过识别重复任务中的手动静默交接点,可以将其拆分为多步骤工作流,每个步骤输出到独立的Markdown文件,下步读取前步结果,实现上下文自动传递。文章以内容构思为例,展示了从Reddit、新闻和arXiv搜索到最终合成的四步工作流,并强调了决策门(人类检查点)的重要性。最后建议从最简单的两步工作流开始,先可靠后复杂。

图像

大家好,我是 leopardracer!

过去,每周找好内容创意要花我几个小时。一个标签页开着 Reddit,另一个开着新闻,第三个开着 arXiv,再开一个 Obsidian 笔记,我把所有东西粘贴进去,试图记住各个部分如何连接。每次 AI 搜索只需几秒,但剩下的时间我都用来当“粘合剂”。

更糟的是,仅仅在不同标签页和聊天窗口之间切换就消耗了我大量注意力。每次切换都会损失专注力,每次重置都让工作显得比实际更沉重。

我当时不知道,与其过度优化提示词,不如直接创建一个工作流。我花了一些时间才找到最佳方法,现在准备分享我的方式——把提示词转化为工作流。

本文将涉及:

  • 为什么提示习惯在规模扩大时会失效
  • 如何识别你的第一个工作流候选
  • 如何在长对话中找到衔接点
  • 能够向前传递上下文的交接模式

如果你正在 AI 聊天标签页之间复制粘贴输出,那你就是在做本应由 AI 处理的协调工作。解决方法是把你的提示词变成一个工作流,让每一步都写入文件,下一步再读取。上下文自动向前传递,无需你手动搬运。你只需在真正需要做决策的地方停下来。

当提示不再奏效

几乎所有人在使用 AI 时都是从同一个方式开始的。你输入一个问题,得到一个答案,复制粘贴到某处,重复。这就是我第一年使用 AI 的方式。我理解,这感觉很高效,因为每次交互都能给你带来一些实实在在的东西。

然后你发现,管理 AI 所花的时间比 AI 帮你节省的时间还多。你在步骤之间复制粘贴,你在记住第三步需要从第一步获取什么。

图像

2025年10月发表的一篇 arXiv 研究 发现,当相关信息嵌入到较长的上下文中时,即使所有无关 token 都被屏蔽,LLM 的准确率也会显著下降。

提示工程博客和课程仍在推销这样的理念:合适的词语能解决一切。它们优化错了层面。你试图通过一个聊天窗口来运行一个流水线,而无论你怎么雕琢词句都无法改变这一点。

提示遇到天花板,意味着你遇到了架构问题。

如何识别你的第一个 AI 工作流

在深入之前,试试这个。想一想你上次用 AI 做的那项重复性任务。那个花了 45 分钟、让你在第 30 分钟时就想尖叫的任务。现在问自己:

  • 我是否在步骤之间复制粘贴了?
  • 我是否因为上下文不断被污染而打开了多个聊天窗口?
  • 我是否必须记住第三步需要从第一步获取什么?
  • AI 在每个步骤都产生了不错的输出,但最终结果却平平?

如果你对其中任何一项回答了“是”,那么你已经有了一个工作流候选。你一直在手动完成协调工作。

这里有一个你可以立即使用的提示。在你完成一项任务后,把它粘贴到你下一次长 AI 对话的末尾:

回顾我们刚才的对话。我将在下面粘贴我最初使用的提示。我希望你分析一下这个任务是否可以转化为一个可复用的技能或工作流。

具体来说:
1. 我采取的步骤是否可以被结构化成一个序列,其中每个步骤产生下一步所需的输出?
2. 是否有需要向前传递上下文的交接点?
3. 这个任务是否更适合拆分成独立的步骤,每个步骤有干净的上下文,而不是作为一个长对话运行?
4. 如果把这个任务变成一个工作流,输入、指令、输出和检查点分别会是怎样的?

这是我最初使用的提示:[在此粘贴你的初始提示]

告诉我这是否是一个好的工作流候选,如果是,请勾勒出每个步骤的大致内容。

在你下一次重复性任务后运行这个提示。你可能会发现自己已经在手动进行工作流形态的工作了。

无论你使用的是 Hermes、Claude Code、Codex、Cowork 还是其他 AI 对话工具,这个方法都适用。模式不变,工具不重要,结构才重要。

如何在长对话中找到衔接点

将长对话转化为工作流的第一步是看清当前流程中的衔接点。

当你有一次长 AI 对话时,留意那些你切换思路的时刻。你说“好了,现在我们来做 X”并开始一个新的思维上下文的时候。你把对话早期的东西复制并粘贴到新请求中的时候。你不得不提醒 AI 你正在做什么因为它忘记了的时候。这些衔接点就是范围蔓延发生的地方。

那些就是你的衔接点。每个衔接点都是工作流中一个潜在的步骤。

我的突破点出现在一个内容构思项目中。我需要为新闻简报文章找到有趣的切入点,这意味着要从多个来源获取信息。Reddit 帖子中浮现出对特定问题的抱怨,新闻文章报道了新兴工具,arXiv 论文暗示了新的能力。

我一开始手动操作,把 Reddit 帖子复制粘贴到文档中,抓取新闻标题,运行 arXiv 搜索并保存摘要。每个来源都在自己的聊天会话中,因为上下文窗口总是被污染。等我处理完 Reddit,已经忘了在新闻搜索中发现了什么。

然后我为每个来源创建了独立的技能。一个技能用于 Reddit 研究,另一个用于新闻抓取,第三个用于 arXiv 论文。每个技能单独运行都很好,但我仍然是它们之间的协调者。我运行 Reddit 技能,保存输出;运行新闻技能,保存输出;运行 arXiv 技能,保存输出。然后我把所有三个结果手动组合成一个最终创意列表。

我在手动做智能体的协调工作。AI 可以做好每一步,但交接才是问题所在。我就是那个中间件。

如何正确向前传递上下文

工作流是一系列步骤,每一步都产生下一步需要的东西。工作流与提示的区别在于,上下文会自动向前移动,而不是你手动搬运。

Anthropic 在 2024 年 12 月发布的 《构建高效智能体》 指南(被广泛引用为权威资料)做了清晰的区分。工作流是指通过预定义的代码路径编排 LLM 和工具的系统。智能体则是指 LLM 动态地指导自身流程的系统。

对于非程序员来说,工作流是最佳选择。你定义路径,AI 在每个节点完成工作。

图像

Anthropic 描述了五种工作流模式。用通俗的话说:

  • 提示链就像一条流水线。第一步的输出成为第二步的输入。每一步都保持简单和专注。
  • 路由将不同的输入分配到不同的路径。就像邮件分拣机根据邮政编码分发信件。
  • 并行化同时运行多个任务。就像有三个研究员而不是一个。
  • 编排器-工作者模式由一个主智能体分解工作并分派给工作者智能体。
  • 评估器-优化器模式让一个智能体做工作,另一个检查它。第一个根据反馈进行修改。

我把承载这一切的文件称为交接文件。每一步都把自己的工作写下来,这样下一步就不需要猜测。格式不如原则重要。它可以是一个 Markdown 文件、一个 Google 文档、一个结构化文本块。重要的是每一步都能产生一些下一步可以读取的东西。

我尝试了所有方法来在步骤之间保持上下文。内存变量在会话结束时消失,数据库条目需要设置和维护,共享状态文件在两个步骤同时写入时会损坏。

Obsidian 中的 Markdown 文件胜出,因为它们既平凡又可靠。

工作流中的每一步都将其输出写入一个 Markdown 文件,下一步读取该文件。文件放在一个镜像工作流的文件夹结构中。当出现问题时,我打开文件,就能看到第三步究竟产生了什么。我沿着链条回溯问题。

这还给了我一个意想不到的好处。我可以追踪每个子智能体或步骤做了什么,并链接到它产生的具体文件。当最终输出听起来有问题时,我打开中间文件,找到偏差从哪里开始的。

Markdown 还有实际优势。纯文本在任何地方都能工作。文件可以在系统之间移动而无需转换。更改可以随时间进行版本控制。所有内容在 Obsidian 中都能很好地渲染,而我本来就用它做笔记。

将上下文存储在数据库或共享状态机制中会增加复杂性,需要额外设置,并产生依赖。Markdown 文件除了一个文件夹和一个文本编辑器外什么都不需要。

每一步都写下自己的工作。下一步读取前一步写下的内容。上下文通过文件向前传递,而不是通过记忆。

逐步构建 AI 工作流

让我展示一下这在实践中是什么样子。我将以我的内容构思工作流为例,但这个结构适用于任何重复性任务。

这个工作流由四个步骤组成。每一步都从上一步的输出文件中读取,并写入自己的输出文件。

第一步:Reddit 研究

  • 输入:要搜索的话题或关键词。
  • 做什么:搜索 Reddit 上人们抱怨与该话题相关问题的帖子。
  • 输出:reddit-findings.md,包含帖子标题、URL 和关键抱怨。

第二步:新闻抓取

  • 输入:相同的话题。
  • 做什么:搜索新闻来源中关于该话题的新兴工具或趋势的文章。
  • 输出:news-findings.md,包含标题、URL 和摘要。

第三步:arXiv 搜索

  • 输入:相同的话题。
  • 做什么:搜索 arXiv 上暗示该话题新能力的论文。
  • 输出:arxiv-findings.md,包含论文标题、摘要和相关说明。

第四步:综合

  • 输入:第一步到第三步的所有三个文件。
  • 做什么:读取所有三个文件,并将它们综合成一个文章角度创意列表。
  • 输出:idea-angles.md,包含 5-10 个潜在文章主题,每个都基于研究。

每一步都获得一个干净的上下文,里面恰好有它需要的东西。没有内容被埋没,没有内容被遗忘。

我最初尝试这个工作流时的样子很丑陋。桌面上的文件,笔记应用里的清单,以及大量的复制粘贴将它们维系在一起。但它是结构化的。每一步都有明确的输入和明确的输出。智能体不需要记住三步之前的东西,因为我给了它恰好需要的东西。

最终,我构建了一个统一的技能来处理整个流水线。它按顺序从 Reddit、新闻源和 arXiv 获取数据,将每批结果写入单独的 Markdown 文件,然后将所有三个文件综合成一个最终创意列表。这个技能从上到下运行,无需我手动在步骤之间复制任何内容。

提示 vs. 工作流:同一个任务

内容构思在提示方式和工作流方式下看起来完全不同。

提示方式:你打开一个聊天窗口,让 AI 搜索 Reddit 上关于某个特定话题的抱怨。它给你一个列表。你把那个列表复制到文档中。你打开一个新的聊天窗口,让它抓取关于同一话题的新闻文章。它给你标题和摘要。你把那些复制到文档中。你再打开另一个聊天窗口,让它搜索 arXiv 上相关的论文。它给你摘要。你也复制那些。

等你做完,文档里就有了三个独立的文本块。现在你需要将它们综合成文章角度。你把所有内容粘贴到一个新的聊天窗口中,要求它提供创意。AI 生成了一个列表,但很泛泛。它丢失了 Reddit 抱怨中的细微差别,因为它们被埋没在合并后的文本中。它也漏掉了 arXiv 的发现,因为它们位于一份 5000 字提示的末尾。

工作流方式:你运行一个技能,搜索 Reddit 并将结果写入名为 reddit-findings.md 的文件。然后该技能搜索新闻源并写入 news-findings.md。接着搜索 arXiv 并写入 arxiv-findings.md。每个文件都干净且聚焦。

最后一步读取所有三个文件,并将它们综合成 idea-angles.md。每一步都获得一个干净的上下文,里面恰好有它需要的东西。没有内容被埋没或遗忘。Clare Liguori 在 AWS 的研究 测试了五种引导智能体行为的方法,覆盖了 3000 次评估运行。简单的提示指令达到了 82.5% 的准确率,这意味着大约每五次交互就有一次失败。当她加入结构化的反馈循环(她称之为“转向钩”)后,在 600 次运行中准确率达到了 100%。

更好的结构带来了差异,而不是更好的提示。

我自己测试了不同模型处理真实 Hermes 工作流时的表现。那些在基准测试中表现亮眼的模型往往在结构化工作流中失败,因为它们要么过度思考简单的步骤,要么忽略格式约束。结构比原始能力更重要。

人类仍需检查的地方

每个工作流都需要检查点,但并非每个步骤都需要。在任何地方都加入审查点会把工作流变成一系列的中断。

我使用决策门。你只会在需要做出真正选择的地方停下来。选择哪个角度,优先考虑哪个来源,是否要删减一个不合适的部分。

如果输出没问题并且不需要做决策,你就不停。工作流会一直运行,直到碰到一个没有你的判断就无法继续的点。

决策门检查输出是否符合你的意图。AI 可能会产生语法正确、研究充分但方向错误的内容。决策门会在下一步建立在一个错误假设上之前捕捉到这一点。

图像

我在我的 Telegram 频道里写了一篇完整的指南,介绍如何在 Hermes 工作流中添加审批门,如果你想要技术细节的话。门通过阻止未经你确认的外部操作来保护你的声誉,通过在系统更改前需要确认来保护你的数据,通过在未经批准的情况下阻止超过阈值的支出来保护你的钱包。

对于大多数工作流,你只需要在输出变得公开或不可逆转的地方设置一个门。内容工作流可能在提纲之后、最终草稿发布之前设一个门。研究工作流可能在综合之后、你根据发现采取行动之前设一个门。

决策门让你在保持方向控制的同时,让 AI 负责执行。

从哪里开始你的第一个工作流

选择一个重复性任务。不是最复杂的那一个。选择你每周都要做、耗时 45 分钟、并在第 30 分钟时让你想尖叫的那一个。那就是你的第一个工作流。

我的第一个工作流是一个早间简报,在喝咖啡前拉取任务和文章。两个步骤。从 Asana 读取,格式化输出,然后交付。简单到可以一个下午搞定,实用到自从我构建它以来每个工作日都在运行。

如果你刚接触 Hermes,先从像这样的两步工作流开始,然后再尝试复杂的东西。

最小可行工作流有四个部分:输入(放进去什么)、指令(智能体做什么)、输出(产出什么)、检查点(你在哪里验证)。你不需要软件,不需要代码。你需要一个包含文件的文件夹。

Anthropic 在《构建高效智能体》中给出的建议是:从简单开始,只在必要时增加复杂性。他们明确警告不要从框架或复杂架构开始。从两步开始,让它们变得可靠,然后再添加第三步。Confluent 关于 AI 工作流的指南 也指出了同样的观点。简单的解决方案往往是最好的起点。从简单的提示工程开始可能不完美,但作为第一轮足够好。当你遇到天花板时,再添加结构。不要预先添加结构。

平凡胜过聪明。你的第一个工作流应该简单到令人尴尬。一个两步流程,包含文件交接和人工审核。就这样。那些从 AI 工作流中获得价值的人构建了平凡的工作流并运行了 50 次,而不是那些令人印象深刻但只运行了两次的工作流。

大多数 AI 生产力建议告诉你写更好的提示。但设计更好的交接才是真正的回报所在。如果每个步骤接收的上下文是干净的,那么每一步的提示可以很平庸。一个在臃肿的聊天线程中的出色提示仍然会产生平庸的输出。

认识到你何时在做本应由 AI 处理的协调工作,是整个转变的核心。一旦你看到这个模式,你就再也无法忽视它。每一个重复性任务都成为结构化的候选,每一次手动交接都成为一个设计问题。

提示遇到天花板,意味着你遇到了架构问题。构建流水线,让上下文流动,把决策权握在手中。

  • 原文链接: x.com/leopardracer/statu...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~

相关文章

0 条评论