高效使用 AI Agent 的技巧 — LessWrong

lesswrong
发布于 2026-04-02 18:28
阅读 33

这篇文章深入探讨了如何高效利用AI代理的实用技巧，涵盖了选择最佳AI模型、使用Git工作树进行代码管理、精细化日志记录、处理AI表现不佳、实现跨会话记忆、优化权限请求以及将更多任务卸载给AI等多个方面，旨在提升软件开发工作流的效率和安全性。

**这篇文章的 AI 使用情况：我独自写了草稿。在写作过程中，我使用 Claude Code 查找参考资料。然后 Claude Code 修正了错别字并审阅了草稿，我手动处理了评论。**

**认识论：我自己的观察，通常受到 X 上的对话和 Zvi 的总结启发。**

正如 Zvi 喜欢重复的那样，[**语言模型提供日常效用**](https://thezvi.substack.com/)。Agent 框架是使用语言模型最先进的方式。与此同时，它们并不完美——能力前沿是参差不齐的，有时它们会犯错，有时它们只是毁掉了[**你 15 年的照片收藏**](https://x.com/Nick_Davidov/status/2019982510478995782)或[**生产数据库**](https://x.com/Al_Grigor/status/2029889772181934425)。因此，如何高效地使用 AI Agent 是一项技能，而我想变得更擅长此道。

在使用 Agent 框架时，你正在使用哪些技巧、诀窍、方法来提高效率？我个人主要关注用于单人软件开发的 Claude Code 和 Codex CLI，但我欢迎针对其他工具和其他使用领域的建议。理想情况下，你分享你尝试过的内容以及对你有用的方法，而我亲自尝试并看看它是否改善了我的工作流程。

以下是我的发现（附带信心指数）。

## 使用最佳模型和最高思考强度

目前可用的最佳模型及其思考强度通常能产生最佳结果，且需要较少的引导。你必须格外注意这意味着什么，例如 Claude Code 默认具有高思考强度，但最佳级别是 max，这需要你自己主动开启。除非你对速度和成本非常敏感，否则你应该这样做。它可能会运行得久一点，消耗更多 Token，但这比需要你进行多次迭代要好得多。

## 使用 Worktrees

在 git 仓库中编写代码时，让每个 AI 会话拥有自己的 git 分支和 Worktree。这样它们可以并行工作，而不会为了编辑相同文件而冲突。直觉上这会导致合并地狱，但幸运的是，AI 非常擅长合并。

## 使用 /fast 模式（视上下文而定）

Codex CLI 允许你开启 /fast 模式，这会将处理速度提高 1.5 倍，但消耗 Token 配额的速度会快 2 倍。如果你从事高度交互的任务，需要你进行大量输入且你不受资金限制，你应该这样做。根据我的经验，如果没有 /fast，AI 慢到我可以在任何一个会话结束前同时处理 5-6 个会话。有了 /fast，会话结束得足够快，我一次只需要 2-3 个。较小的批次意味着更少的上下文切换，我发现这在整体上更有效率。

该开关是全局的，因此它会同时影响你的所有会话。

Claude Code 也有 /fast 来提高 2.5 倍的处理速度，但它会在订阅费之外根据 API 价格向你额外收费，而且非常昂贵（[**$2-5/分钟/Agent**](https://x.com/seconds_0/status/2020215339091652610)）。我还没有尝试过。

## 详细日志记录

我发现，一旦我开始进行极其详细的日志记录，我的软件开发效率就大大提高了。这个想法是，一旦出现问题，这会给 AI 提供一个已发生事情的轨迹，我只需要非常简要地描述高级症状，它就可以自行从日志中进行调查。当问题难以重现或偶尔发生时，这尤其有用。这种方法的另一个变体是想办法从你的应用中导出调试信息，并引用特定的对象或实例。这样，当出现问题时，你只需一键将其提供给 AI，让它进行调查。

## AI 也有状态不好的时候

我不知道原因，但偶尔我会遇到那么几天，AI 似乎完全无能。以前发一条消息它就能正确实现一堆东西，而现在它一直误解我的意图，我需要迭代 30 次它仍然不明白，而且过程从未收敛。在这种情况下，我会切换到竞争对手（基本上是 Opus 4.6 <> GPT5.4）。关键是要尽早发现这一点并尽早切换。这非常令人沮丧，因为在 Claude Code 和 Codex 之间迁移所有的技能和设置非常糟糕，而且我没有高效的方法来做到这一点。

## 跨会话记忆

我自己还没有找到解决这个问题的办法，但我坚信这将产生巨大影响。我希望当前的 AI 会话能够无缝访问我过去提供给它的所有信息。Claude 和 ChatGPT 在它们的 Web 界面中都实现了这一点，但在 Claude Code / Codex CLI 中没有。我目前正在尝试 [github.com/doobidoo/mcp-memory-service](https://github.com/doobidoo/mcp-memory-service)。发现的问题：

1. 它是面向开发者的（例如，大多是技术事实和选择），但我想要通用的记忆系统（例如，也包括个人背景）。
2. 自动保存记忆不起作用——Claude 会忽略 CLAUDE.md，而会话结束的方法似乎是基于正则表达式的。

记忆检索似乎还可以。我正在尝试在后台使用一个单独的 Claude 会话来从每条消息中提取记忆。

## 在新会话中请求审阅

令我惊讶的是，仅仅要求相同 AI 的一个新会话来审阅计划或工作，通常会带来原始会话遗漏的有益见解。你也可以询问不同的 AI。我的假设是，原始会话必须关心大量细节，因此其注意力被分散了，而新会话可以只专注于这次特定的审阅，从而分配更高的有效脑力。

## 你才是瓶颈

这是多个想法的指导原则。基本上，根据我的经验，AI 在大多数时间都运行良好，而完成工作的瓶颈在于我。

### 自动解析权限请求

我阻碍 AI 的第一种方式是审阅它执行任务的权限请求。许多人通过 YOLO 模式解决了这个问题，在这种模式下，AI 可以做任何它想做的事情。我珍惜我的照片和生产数据库，所以我不放心这样做。我还担心来自网络的 Prompt 注入。

我看到有两种方法可以部分解决这个问题：

1. 尽可能将明显安全的命令列入白名单。基本上，在你给出每次批准后，问问自己这个命令让 AI 自行运行是否安全。
2. 让另一个 AI 审阅权限请求。在 Claude Code 中，这是通过 [**Auto Mode**](https://code.claude.com/docs/en/permission-modes#eliminate-prompts-with-auto-mode) 完成的。在 Auto Mode 出现之前，我通过 hook 编写了自己的解决方案。通过使用我自己的解决方案，我可以控制所使用的 Prompt 和模型；审阅 Agent 也可以使用工具和多个步骤。

### 权限请求通知

默认情况下，除了终端中的文本外，你得不到任何 AI 需要你注意审阅其权限请求的指示。因此，当并行处理多个 AI 会话时，很容易错过。你应该至少为需要你注意的新权限请求或 AI 完成其轮次设置声音通知。

### 所有会话概览

如果你只添加声音通知，并且你在多个虚拟工作区中有 10 个会话，那么找到正确的窗口就很麻烦。我通过制作自己的仪表板来监督所有会话的状态解决了这个问题。这里的主要想法是，你需要某种方式来快速识别哪个会话需要你的注意，而无需逐一检查。

![2026-03-28_15-05.png](https://img.learnblockchain.cn/2026/04/13/k7ujb2s5ous6mhet0wgi.png)

### 尽可能多地将工作卸载给 AI

你的注意力是瓶颈，所以如果你能让 AI 哪怕多做一点你原本必须做的事情，你就应该这样做。即使 AI 完成它需要更长的时间。

就我而言，我为它设计了一个技能，让它为我展示其 UI 更改。它在 Worktree 的 docker 中运行网站，完全准备好 UI 测试所需的数据库状态，自行测试 UI 并修复它发现的任何问题。然后它准备好我需要审查的确切屏幕，并给我一个我需要检查的内容概览。

## 触发子 Agent 的简便方法

例如——我有 5 个测试用例需要审阅。我告诉 AI 启动 5 个新会话——每个测试用例一个——它们并行测试并准备审阅。我觉得这应该是轻松获得更多效能的一种方式，但我很难想出持续有效的方法来做到这一点。

## 构建你自己的 UI

我编写了自己的 UI 来包装 Codex 的 App Server。我的主要目标是权限的自动审阅和更好的 hook。总的来说，我发现这非常有趣，因为我可以看到我是如何使用这个工具的，发现低效之处并立即解决。主要的缺点是复杂度增长很快，所以开发这个需要大量时间。

![2026-03-28_15-20.png](https://img.learnblockchain.cn/2026/04/13/oelm1rrl9w6q0v2e6vcx.png)

我没料到会在这里写下这么多想法，但列出所有这些想法很有用。我很想听听你们关于如何更高效地使用 AI Agent 的想法。

>- 原文链接： [lesswrong.com/posts/9xAw...](https://www.lesswrong.com/posts/9xAwybDhtgzGYPnbs/the-skill-of-using-ai-agents-well)
>- 登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

这篇文章的 AI 使用情况：我独自写了草稿。在写作过程中，我使用 Claude Code 查找参考资料。然后 Claude Code 修正了错别字并审阅了草稿，我手动处理了评论。

认识论：我自己的观察，通常受到 X 上的对话和 Zvi 的总结启发。

正如 Zvi 喜欢重复的那样，语言模型提供日常效用。Agent 框架是使用语言模型最先进的方式。与此同时，它们并不完美——能力前沿是参差不齐的，有时它们会犯错，有时它们只是毁掉了你 15 年的照片收藏或生产数据库。因此，如何高效地使用 AI Agent 是一项技能，而我想变得更擅长此道。

以下是我的发现（附带信心指数）。

使用最佳模型和最高思考强度

使用 Worktrees

使用 /fast 模式（视上下文而定）

该开关是全局的，因此它会同时影响你的所有会话。

Claude Code 也有 /fast 来提高 2.5 倍的处理速度，但它会在订阅费之外根据 API 价格向你额外收费，而且非常昂贵（$2-5/分钟/Agent）。我还没有尝试过。

详细日志记录

AI 也有状态不好的时候

跨会话记忆

我自己还没有找到解决这个问题的办法，但我坚信这将产生巨大影响。我希望当前的 AI 会话能够无缝访问我过去提供给它的所有信息。Claude 和 ChatGPT 在它们的 Web 界面中都实现了这一点，但在 Claude Code / Codex CLI 中没有。我目前正在尝试 github.com/doobidoo/mcp-memory-service。发现的问题：

它是面向开发者的（例如，大多是技术事实和选择），但我想要通用的记忆系统（例如，也包括个人背景）。
自动保存记忆不起作用——Claude 会忽略 CLAUDE.md，而会话结束的方法似乎是基于正则表达式的。

记忆检索似乎还可以。我正在尝试在后台使用一个单独的 Claude 会话来从每条消息中提取记忆。

在新会话中请求审阅

你才是瓶颈

这是多个想法的指导原则。基本上，根据我的经验，AI 在大多数时间都运行良好，而完成工作的瓶颈在于我。

自动解析权限请求

我看到有两种方法可以部分解决这个问题：

尽可能将明显安全的命令列入白名单。基本上，在你给出每次批准后，问问自己这个命令让 AI 自行运行是否安全。
让另一个 AI 审阅权限请求。在 Claude Code 中，这是通过 Auto Mode 完成的。在 Auto Mode 出现之前，我通过 hook 编写了自己的解决方案。通过使用我自己的解决方案，我可以控制所使用的 Prompt 和模型；审阅 Agent 也可以使用工具和多个步骤。

权限请求通知

所有会话概览

尽可能多地将工作卸载给 AI