如何避免达到Claude使用限制

ruben_ 发布于 2026-04-13 阅读 8

本文分享了23个节省Claude AI使用额度的实用技巧,从如何避免浪费Token到优化工作流程,包括文件预处理、选择合适的模型、利用项目缓存、编辑消息而非发送跟进、批量任务等,帮助用户更高效地使用Claude,减少达到限制的频率。

你在为 Claude 付费。但你消耗额度的速度,就像每个房间都不关灯的人一样。

我知道,因为我曾经也一样,持续了几周。每天下午两点就触及使用上限,盯着 "你已达到使用上限" 的屏幕,怀疑 20 美元的套餐是否够用。

我确实升级到了 100 美元的套餐……但我还在不断收到同样的私信:

我的团队成员在抱怨,所以是时候为其他人解决这个问题了。

"Ruben,我在 Claude 的使用限额上遇到了问题……怎么才能省着用?"

所以我为团队列了一份清单,教他们如何节省 Claude 积分。

这份免费指南列出了 23 个习惯,按从最不为人知到最显而易见的顺序排列。

现在,我可能一个月才碰到一次上限,甚至更少。

开始之前先说两件事:

  1. 保存这份指南。本周挑选 3 个习惯去实践。到周五你就能感受到不同。

  2. 把它发给你团队里那些总是抱怨 Claude 上限的成员。

PS:这份通讯主要靠你的 分享 来增长。而我持续达到 1000+ 次分享!这是我的北极星。我现在知道你喜欢什么(或不喜欢什么)。它完全免费,还能帮助我保持专注。


Claude 计算 Token。

Claude 计算 Token。一个 Token 大约相当于一个单词。

解释 Token 最简单的方式是:它大约等于 一个单词

你发送一条消息,Claude 会从头重新读取你的整个对话。之前的每条消息。之前的每个回答。全部都要读取。

所以第 1 条消息花费很少。但第 30 条消息呢?Claude 在开始思考你的新问题之前,必须先重新读取之前 29 轮的交流。

这就是你的积分会消失的原因。对话变长,每条消息的代价越来越高。

你从这份通讯中应用的每一个习惯,都可以归结为这一个理念:如何避免浪费 Token,以便你能把它们花在真正重要的事情上。


你可能不知道的习惯。

下面这些改变了我花费 Token 方式的习惯。

大部分是我偶然发现的。少数来自 Anthropic 几乎没人读的官方文档(我知道你没读,别撒谎了)。

1. 上传文件前先进行转换。

一页 PDF 需要 1,500 到 3,000 个 Token。截图更糟糕(一张完整的 1000×1000 图片大约需要 1,300 个 Token)。DOCX 和 PPTX 文件携带你看不到的元数据膨胀。

  • 上传前,提取文本。将相关段落复制粘贴到纯文本或 Markdown 文件中。

  • 将截图裁剪得紧贴只显示相关的部分(紧密裁剪可以从 1,300 个 Token 降到 100 以下)。

  • 如果你把同一份 15 页的 PDF 上传到 4 个不同的对话中,你就在一个本可以转换成 2,000 Token 纯文本的文档上浪费了 180,000+ Token。

我最喜欢的工作流程如下:

  1. 打开一个 Google 文档(小技巧:在地址栏输入 doc.new )。

  2. 粘贴需要上传到 Claude 的文本。

  3. 下载文件为 .md 格式。

doc.new → 粘贴文本 → 文件 → 下载 → Markdown (.md)

2. 在 Chat 中规划,最后再创建文件。

Anthropic 确认,文件创建(电子表格、文档、演示文稿)比普通聊天消息消耗更多额度。

所以不要打开 Cowork 就说 "给我创建一个财务模型。"

相反:打开 Chat,规划结构,确定章节,敲定假设。然后,一旦你确切知道想要什么,再转到 Cowork 并说 "构建这个确切文件。"

→ 你在成本较低的产品中思考。

→ 你在成本较高的产品中构建。

你在 Claude (chat) 中规划。

你将 Claude Chat 的答案(一旦你喜欢)复制下来,然后粘贴到 Cowork + Opus 4.6 + Extended thinking 中。

3. 说"问我问题"而不是写长提示。

一个 500 词的提示每次 Claude 重新读取对话时都要花费 500 个 Token。但如果你写一个 15 词的提示,让 AskUserQuestion 去做,那么澄清问题只会生成一次,你的回答只是简单的点击。

我最常用的提示不到 30 个词:"我想[任务]以达到[成功标准]。读取我的文件夹。在你开始之前,使用 AskUserQuestion 向我提问。"

这是个重要任务,别笑。说正经的:这是我最喜欢的 Claude 功能。只需调用 "AskUserQuestion tool"。

点击选项几乎不花什么 Token。键入大段指令则花费很多。让 Claude 从你那里抽取上下文,而不是你向它推送大段文字。

4. 使用 Wispr Flow 提供更丰富的回答(同时避免 Token 膨胀)。

Wispr Flow 是一个语音转文本工具。我在这里解释了如何每天使用它: 使用 Wispr Flow 的日常

这听起来似乎违反直觉:用说的代替打字,反而能使用更少的 Token?

原因如下。当你打字时,你会写出懒惰的提示。"让它更好。""改改语气。"模糊不清。Claude 猜错。然后你不断发送越来越多消息(Claude 不得不反复重新读取一切)。

当你说话时,你自然会一次性地给出更多上下文。"语气太僵硬了。我希望它听起来像我在给一个经营 200 人公司的朋友发短信。保留数据,但随意一些。只重做第 2 部分。"

消息更少 = 上下文重新加载更少 = 节省 Token。

5. 别再让 Claude 重做整个东西。

当报告的第 3 部分出错时,不要说 "重做报告。"

要说 "只重做第 3 部分。其他部分保留以节省 Token。"

每次完全重做都意味着 Claude 重新生成整个输出。如果你的报告是 2,000 Token,那就又烧掉了 2,000 个输出 Token。指出具体部分。告诉 Claude 它哪里错了。

同时,当你确切知道想要什么时,在提示中加入 "不要评论。不要解释。只输出内容。" Claude 默认会乐于助人且啰嗦。

每一句 "很高兴帮忙!以下是我所做的……" 都是你在付费的 Token。

6. 将任务批量合并在一条消息中。

三个独立的提示 = 三次完整的上下文重新加载。

一条包含三个任务的提示 = 一次重新加载。

不要发送 "总结这篇文章" 然后 "列出要点" 然后 "建议一个标题",直接写:"总结这篇文章,列出要点,并建议一个标题。"

额外好处:答案通常会变得更好。

Claude 需要一次性看到全局……就像正常人一样。

7. 每次使用相同的提示结构。

Anthropic 证实,你经常使用的类似提示会被部分缓存。他们没有公布具体机制,但实际结论很清楚:保持一个稳定的提示库,只替换可变部分。

我 80% 的 Cowork 会话都使用相同的 30 词结构:

"我想[任务]以达到[成功标准]。读取我的文件夹。在你开始之前,使用 AskUserQuestion 向我提问。"

8. 编辑你的消息,而不是发送后续补充。

这是我最喜欢的技巧。我一直在用。

在 Chat(不是 Cowork)中,你可以点击你原始消息上的 编辑,修改它,然后重新生成。旧的那轮交换会被替换掉,而不是堆叠起来。

去你的上一条消息,点击 编辑 按钮

它会打开这样一个框,你编辑提示,然后点击 保存

每次你发送 "不,我意思是……""实际上,把 X 改成 Y" 时,你都在增加对话历史。编辑按钮完全避免了这一点。

额外好处:当 Claude 没答对时,你可以直接 "回去",这一点也很棒。

9. 为任务选择正确的产品。

  • 快速提问?用 Haiku 聊天。

  • 基于你的文件写一份报告?用 Cowork + Opus。

  • 根据数据构建图表?用 Sonnet 写代码。

每个产品每次交互的 Token 成本不同。Chat 最轻。Cowork 最重。将工具与任务匹配,意味着你不再为 Chat 级别的工作支付 Cowork 的价格。

同样适用于一个几乎没人用的功能(不知为何),即 Chat 的 研究 功能:

顾名思义,它研究得相当深入(消耗大量 Token)


仍然重要的基础点。

你可能知道其中一些。

10. 保持你的 ABOUT ME 文件每个不超过 2,000 字。

我在上一篇 **Claude Cowork 指南**中解释了一切。

但你已经读过了,对吧? 对吧?

Cowork 在每次任务前都要读取你的文件夹。如果你的 about-me 文件有 22,000 字(我以前就是这样),那么在任何实际工作开始之前,就已经烧掉了成千上万的 Token。每次会话。每次任务。

我把它缩减到了 2,000 字以下。

专业提示:在 Cowork 会话结束时,提示 "写一个 session-notes.md,包含关键决策和下一步行动。" 下一次会话开始时,先说 "先读取 session-notes.md。"

你可以下载它,然后开始一个新的会话。不浪费 Token!

你可以将上下文向前传递,而无需从头重新解释一切。

11. 重启对话,而不是发送后续消息。

当 Cowork 出错时,你的本能是输入 "不,我意思是……" 并发送另一条消息。每条后续消息都堆叠在完整的对话历史之上。Claude 再次重新读取所有内容。

一条 20 条消息的会话大约消耗 105,000 个 Token。

一条 30 条消息的会话消耗 232,000 个。这很疯狂,对吧?

既然你不能在 Cowork 中编辑提示(以便回去),你仍然可以在较早的消息上 "从这里重启对话"。你重启的位置越靠上,节省的 Token 就越多。

尽可能回溯到更早的位置。

如果整个会话都跑偏了,那就开始一个新的。粘贴一行你需要的摘要。重新开始。

12. 每 15-20 条消息总结一次并重新开始。

长对话是 Token 熔炉。

一位开发者追踪了他的使用情况,发现 98.5% 的 Token 花在了重新读取历史记录上。只有 1.5% 用于实际输出。

当 Cowork 会话变长时:让 Claude 总结所有重要内容,复制那份总结,打开一个新的会话,将其作为第一条消息粘贴进去。

13. 对于简单任务使用 Sonnet 或 Haiku。把 Opus 留给深度工作。

语法检查、头脑风暴、重新格式化、简短回答。Sonnet 处理所有这些,成本只是一小部分。

Opus + Extended thinking 是你的重型机械。不要用重型机械去挪一把椅子。

我的规则:如果任务让 Claude 花不到 30 秒回答,那它可能不需要 Opus。在开始会话之前切换模型。只需 2 次点击。

有时它藏在 "更多模型" 下面。

14. 不要把整个文件夹都塞进 Cowork。

我见过有人把 50 个文件放进他们的 Cowork 文件夹 "以防万一。"

Cowork 读取的每个文件都是花掉的 Token。而且如果你的文件太大,Cowork 会开始粗略地总结它们,而不是仔细阅读。

如果 Claude 不需要它为这个任务服务,那它就不应该被读取。

对于那些根本不需要你文件的 Cowork 任务(比如使用连接器快速起草一封邮件),在开始会话时选择零个文件夹。

在 Cowork 中,当它显示 "在项目中工作" 时,意味着没有选择项目。最大程度节省 Token(对于简单任务)。

零文件夹 = 零本地文件上下文 = 在你输入之前就已经节省了 Token。

15. 当话题改变时,开始一个新的聊天。

你让 Claude 帮忙写一篇 LinkedIn 帖子。然后你问了关于客户提案的事。然后是一个食谱。都在同一个聊天里。嗯……别这样。

Claude 每次考虑你的晚餐时,仍然在重读 LinkedIn 帖子和客户提案的对话。那些旧消息是累赘。花在对你当前问题毫无帮助的上下文上的 Token。

新话题 = 新聊天。永远如此。

16. 关闭你不需要的功能。

网络搜索、连接器和 "探索" 模式都会在每个回答中增加 Token。即使你不需要它们。

写你自己的内容?关闭搜索和工具。做简单的语法检查?关闭扩展思考。这些功能很强大,但消耗 Token。只在真正需要时开启它们。

我的默认设置:全部关闭。我按任务开启功能,而不是按账户。

我几乎一直在使用扩展思考,但我付费的是 100 美元的套餐。

当你确实使用连接器(Slack、Google Drive、Notion)时,要具体说明你需要什么。"搜索 Slack 过去 7 天关于 Q2 发布的消息" 远比 "搜索 Slack 中任何关于发布的信息" 节省得多。

这里我开启了网络搜索加大量连接器。所以消耗了大量 Token。如果不需要就关掉它们。

过滤检索 = 加载的结果更少 = 消耗的 Token 更少。

17. 对重复性工作使用 Projects。

如果你将同一个 PDF 上传到五个不同的聊天中,Claude 每次都会对该文档重新进行 Token 化。五个聊天,五次完整读取。

改用 Projects。上传文件一次。它会被缓存(即保存)。

你在项目中上传了一次文件,之后所有新的聊天都知道这个文件(无需一遍又一遍地重新读取)。

该项目内的每个新对话都会引用它,而不会再次消耗 Token。Anthropic 确认,重复使用的项目内容不会像全新上传那样被计算。

在付费计划中,Projects 还使用 RAG,这意味着 Claude 只检索相关片段,而不是将整个文档加载到上下文窗口中。

如果你经常处理合同、品牌指南、研究论文或任何你经常引用的文档,单凭这一点就能大幅减少你的 Token 开销。

18. 关闭记忆功能,添加用户偏好。

每个没有保存上下文的新聊天都会在设置上浪费 3-5 条消息。

"我是一名营销人员,我写作风格随意,我更喜欢短段落……"

所以这样做:

设置 > 通用 > 个人偏好。

我总是关闭记忆功能。我不喜欢它,它很奇怪。

同时设置 Styles(你可以在模型选择器里找到)。

它在 Chat 中的 + 里面。

选择 "简洁" 或创建一个自定义风格。它在各聊天之间持久存在,不会吃掉你的上下文。一次设置,永久节省。

19. 对重复性工作使用定时任务。

如果你每周运行相同的报告、摘要或研究任务,不要在一个不断增长的 Cowork 会话中手动进行。

使用 /schedule 插件。

试试 /schedule 插件。

你的任务会在这里。

20. 在 Claude Code 开始之前给它一个清晰的范围。

你可能认为 Claude Code 只适合开发者。我用它来为我的技术团队创建简报和快速构建数据可视化。我解释了如何使用:

Claude Code。

  • 原文链接: ruben.substack.com/p/how...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~

相关文章

0 条评论