高效使用 AI Agent 的技巧 — LessWrong

  • lesswrong
  • 发布于 2026-04-02 18:28
  • 阅读 33

这篇文章深入探讨了如何高效利用AI代理的实用技巧,涵盖了选择最佳AI模型、使用Git工作树进行代码管理、精细化日志记录、处理AI表现不佳、实现跨会话记忆、优化权限请求以及将更多任务卸载给AI等多个方面,旨在提升软件开发工作流的效率和安全性。

这篇文章的 AI 使用情况:我独自写了草稿。在写作过程中,我使用 Claude Code 查找参考资料。然后 Claude Code 修正了错别字并审阅了草稿,我手动处理了评论。

认识论:我自己的观察,通常受到 X 上的对话和 Zvi 的总结启发。

正如 Zvi 喜欢重复的那样,语言模型提供日常效用。Agent 框架是使用语言模型最先进的方式。与此同时,它们并不完美——能力前沿是参差不齐的,有时它们会犯错,有时它们只是毁掉了你 15 年的照片收藏生产数据库。因此,如何高效地使用 AI Agent 是一项技能,而我想变得更擅长此道。

在使用 Agent 框架时,你正在使用哪些技巧、诀窍、方法来提高效率?我个人主要关注用于单人软件开发的 Claude Code 和 Codex CLI,但我欢迎针对其他工具和其他使用领域的建议。理想情况下,你分享你尝试过的内容以及对你有用的方法,而我亲自尝试并看看它是否改善了我的工作流程。

以下是我的发现(附带信心指数)。

使用最佳模型和最高思考强度

目前可用的最佳模型及其思考强度通常能产生最佳结果,且需要较少的引导。你必须格外注意这意味着什么,例如 Claude Code 默认具有高思考强度,但最佳级别是 max,这需要你自己主动开启。除非你对速度和成本非常敏感,否则你应该这样做。它可能会运行得久一点,消耗更多 Token,但这比需要你进行多次迭代要好得多。

使用 Worktrees

在 git 仓库中编写代码时,让每个 AI 会话拥有自己的 git 分支和 Worktree。这样它们可以并行工作,而不会为了编辑相同文件而冲突。直觉上这会导致合并地狱,但幸运的是,AI 非常擅长合并。

使用 /fast 模式(视上下文而定)

Codex CLI 允许你开启 /fast 模式,这会将处理速度提高 1.5 倍,但消耗 Token 配额的速度会快 2 倍。如果你从事高度交互的任务,需要你进行大量输入且你不受资金限制,你应该这样做。根据我的经验,如果没有 /fast,AI 慢到我可以在任何一个会话结束前同时处理 5-6 个会话。有了 /fast,会话结束得足够快,我一次只需要 2-3 个。较小的批次意味着更少的上下文切换,我发现这在整体上更有效率。

该开关是全局的,因此它会同时影响你的所有会话。

Claude Code 也有 /fast 来提高 2.5 倍的处理速度,但它会在订阅费之外根据 API 价格向你额外收费,而且非常昂贵($2-5/分钟/Agent)。我还没有尝试过。

详细日志记录

我发现,一旦我开始进行极其详细的日志记录,我的软件开发效率就大大提高了。这个想法是,一旦出现问题,这会给 AI 提供一个已发生事情的轨迹,我只需要非常简要地描述高级症状,它就可以自行从日志中进行调查。当问题难以重现或偶尔发生时,这尤其有用。这种方法的另一个变体是想办法从你的应用中导出调试信息,并引用特定的对象或实例。这样,当出现问题时,你只需一键将其提供给 AI,让它进行调查。

AI 也有状态不好的时候

我不知道原因,但偶尔我会遇到那么几天,AI 似乎完全无能。以前发一条消息它就能正确实现一堆东西,而现在它一直误解我的意图,我需要迭代 30 次它仍然不明白,而且过程从未收敛。在这种情况下,我会切换到竞争对手(基本上是 Opus 4.6 <> GPT5.4)。关键是要尽早发现这一点并尽早切换。这非常令人沮丧,因为在 Claude Code 和 Codex 之间迁移所有的技能和设置非常糟糕,而且我没有高效的方法来做到这一点。

跨会话记忆

我自己还没有找到解决这个问题的办法,但我坚信这将产生巨大影响。我希望当前的 AI 会话能够无缝访问我过去提供给它的所有信息。Claude 和 ChatGPT 在它们的 Web 界面中都实现了这一点,但在 Claude Code / Codex CLI 中没有。我目前正在尝试 github.com/doobidoo/mcp-memory-service。发现的问题:

  1. 它是面向开发者的(例如,大多是技术事实和选择),但我想要通用的记忆系统(例如,也包括个人背景)。
  2. 自动保存记忆不起作用——Claude 会忽略 CLAUDE.md,而会话结束的方法似乎是基于正则表达式的。

记忆检索似乎还可以。我正在尝试在后台使用一个单独的 Claude 会话来从每条消息中提取记忆。

在新会话中请求审阅

令我惊讶的是,仅仅要求相同 AI 的一个新会话来审阅计划或工作,通常会带来原始会话遗漏的有益见解。你也可以询问不同的 AI。我的假设是,原始会话必须关心大量细节,因此其注意力被分散了,而新会话可以只专注于这次特定的审阅,从而分配更高的有效脑力。

你才是瓶颈

这是多个想法的指导原则。基本上,根据我的经验,AI 在大多数时间都运行良好,而完成工作的瓶颈在于我。

自动解析权限请求

我阻碍 AI 的第一种方式是审阅它执行任务的权限请求。许多人通过 YOLO 模式解决了这个问题,在这种模式下,AI 可以做任何它想做的事情。我珍惜我的照片和生产数据库,所以我不放心这样做。我还担心来自网络的 Prompt 注入。

我看到有两种方法可以部分解决这个问题:

  1. 尽可能将明显安全的命令列入白名单。基本上,在你给出每次批准后,问问自己这个命令让 AI 自行运行是否安全。
  2. 让另一个 AI 审阅权限请求。在 Claude Code 中,这是通过 Auto Mode 完成的。在 Auto Mode 出现之前,我通过 hook 编写了自己的解决方案。通过使用我自己的解决方案,我可以控制所使用的 Prompt 和模型;审阅 Agent 也可以使用工具和多个步骤。

权限请求通知

默认情况下,除了终端中的文本外,你得不到任何 AI 需要你注意审阅其权限请求的指示。因此,当并行处理多个 AI 会话时,很容易错过。你应该至少为需要你注意的新权限请求或 AI 完成其轮次设置声音通知。

所有会话概览

如果你只添加声音通知,并且你在多个虚拟工作区中有 10 个会话,那么找到正确的窗口就很麻烦。我通过制作自己的仪表板来监督所有会话的状态解决了这个问题。这里的主要想法是,你需要某种方式来快速识别哪个会话需要你的注意,而无需逐一检查。

2026-03-28_15-05.png

尽可能多地将工作卸载给 AI

你的注意力是瓶颈,所以如果你能让 AI 哪怕多做一点你原本必须做的事情,你就应该这样做。即使 AI 完成它需要更长的时间。

就我而言,我为它设计了一个技能,让它为我展示其 UI 更改。它在 Worktree 的 docker 中运行网站,完全准备好 UI 测试所需的数据库状态,自行测试 UI 并修复它发现的任何问题。然后它准备好我需要审查的确切屏幕,并给我一个我需要检查的内容概览。

触发子 Agent 的简便方法

例如——我有 5 个测试用例需要审阅。我告诉 AI 启动 5 个新会话——每个测试用例一个——它们并行测试并准备审阅。我觉得这应该是轻松获得更多效能的一种方式,但我很难想出持续有效的方法来做到这一点。

构建你自己的 UI

我编写了自己的 UI 来包装 Codex 的 App Server。我的主要目标是权限的自动审阅和更好的 hook。总的来说,我发现这非常有趣,因为我可以看到我是如何使用这个工具的,发现低效之处并立即解决。主要的缺点是复杂度增长很快,所以开发这个需要大量时间。

2026-03-28_15-20.png

我没料到会在这里写下这么多想法,但列出所有这些想法很有用。我很想听听你们关于如何更高效地使用 AI Agent 的想法。

  • 原文链接: lesswrong.com/posts/9xAw...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
lesswrong
lesswrong
江湖只有他的大名,没有他的介绍。