Hermes Agent 全方位入门指南(2026年4月版)
Hermes Agent 是由 Nous Research 开发的开源 AI 智能体,核心特色在于持久化记忆和自动化的“技能”学习机制。
Hermes Agent 究竟是什么
Hermes Agent 是由 Nous Research 开发的一款开源 AI Agent,它运行在你的本地机器或廉价的 VPS 上,能够跨会话记住所学内容,并在工作中编写自己的可重用技能。它通过 CLI、Telegram、Discord、电子邮件以及许多其他消息平台与你交流。截至 2026-04-20,其 GitHub stars 数已达 104,791,是 2026 年增长最快的开源 Agent。
30 秒速览
你只需一条 curl 命令即可安装 Hermes。选择一个模型提供商(众多热门选项)和一个模型(Claude、GPT-5.4、GLM-5.1、MiniMax,甚至是本地的 Ollama 模型)。然后给它分配一个任务——例如“每天早上 8 点汇总我的 GitHub 通知”,或“帮我调试这个 Python 脚本”,或“监控这个网站,价格下跌时在 Telegram 上提醒我”。
它开始运行,并持续学习。一周后,同样的任务会产生更精炼的输出,因为 Hermes 一直在默默编写技能——那些记录有效方法的小型 Markdown 文件——并将它们应用到后续的运行中。
这就是产品的全部。安装、分配任务,然后让它产生复利效应。
2 分钟详解
大多数 AI 工具是无状态的:你打开聊天窗口,提出问题,关闭标签页,下一次会话又从头开始。Hermes 颠覆了这一点。它常驻于个人电脑或虚拟专用服务器 (VPS) 上,拥有持久化内存。每当它弄明白某件事,就会创建技能——即可重复使用的流程。它可以通过你偏好的任何渠道联系你:终端、Telegram 机器人、定时任务 (cron job)、Webhook。
其核心架构理念是 Harness Engineering:Nous 认为,2026 年真正的突破并非更智能的模型,而是围绕模型构建的更智能的“包装器”。因此,Hermes 在围绕大语言模型 (LLM) 的五个层面投入巨大——指令、约束、反馈、记忆、编排——并允许你随时更换模型本身。今天用前沿模型,明天换本地模型,明年可能又是别的。
你会听到人们称它为“与你共同成长的 Agent”。这既是 Nous 的宣传语,也是一个有用的心智模型:第一天,Hermes 是一个通用助手;第三十天,它就成了你的助手,融入了三十天学习所得的偏好。
预览:学习循环
每隔几次工具调用,Hermes 就会暂停并自问:刚才发生了什么?哪些做法有效?哪些失败了?这应该转化为一项技能吗? 当答案为“是”时,它会将一个技能文件写入 ~/.hermes/skills/ 目录,供后续使用。这些技能是纯 Markdown 格式,你可以阅读、编辑它们,或删除那些它理解有误的技能。
这是最重要的单一特性,我们将在“学习循环”部分详细展开。
Hermes 适合谁
Hermes 主要吸引三类用户。弄清楚你属于哪一类,有助于理解手册的其余部分。
CLI 开发者
你以终端为家。你已经在使用 Claude Code 或 Cursor 进行编辑器内编码。你需要一个位于编辑器之外的 Agent——一个无需离开 CLI 就能向其发出“审计代码库中的死代码”或“为我们的 0.9 → 0.10 版本升级编写迁移计划”等指令的助手。
你首先会使用的功能: hermes CLI、技能、记忆。暂时可忽略: Telegram、cron、多 Agent。
自动化操作员
你不一定编写代码。你需要一个能在你睡觉时执行重复性工作的 Agent——汇总新闻、监控市场、生成报告、整理收件箱。你会将 Hermes 部署在 Mac Mini 或 5 美元的 VPS 上,并将其连接到你所用的各种消息渠道。
你首先会使用的功能: cron、消息网关、记忆。暂时可忽略: 代码执行、多 Agent。
Telegram 机器人用户
你需要一个可以随时从手机联系的常驻 Agent。无论旅行、开会还是健身,只需给 Hermes 发消息,它就会回应。Telegram 集成是这里的杀手级功能。
你首先会使用的功能: 消息网关、语音、技能。暂时可忽略: 本地 CLI 使用。
你属于哪一类?
| 如果你想... | 从...开始 | 暂时跳过... |
|---|---|---|
| 在终端中编写更好的代码 | CLI + 技能 | Telegram, cron |
| 自动化重复性任务 | Cron + 网关 | 代码执行 |
| 从手机与 Agent 聊天 | Telegram + 语音 | CLI 工作流 |
这三类用法后续可以共存。建议第一周先专注于一种。
它有何不同
你可能已经在使用 Claude Code、Cursor 或 OpenClaw。那么 Hermes 的定位是什么?
一句话概括
Claude Code 是代码库内的编码 Agent。Cursor 是编辑器内的结对编程助手。OpenClaw 是配置驱动的任务运行器。Hermes 则是一个自我改进的自主 Agent,存在于所有这些工具之外。 大多数高级用户会同时运行其中的两到三个,而非只选一个。
功能对比一览
| 功能 | Claude Code | Cursor | OpenClaw | Hermes Agent |
|---|---|---|---|---|
| 主要界面 | 代码库内的 CLI | IDE | CLI + 配置文件 | CLI + 聊天 + cron + Telegram |
| 持久化记忆 | 会话范围 | 项目范围 | 基于配置文件 | 跨会话,有容量限制 (MEMORY.md, USER.md) |
| 学习能力 | 无 | 无 | 无 | 检测到重复模式后自动生成技能 |
| 通信渠道 | 终端 | 编辑器 | 终端 | 终端, Telegram, Discord, 电子邮件, Webhooks |
| 定时任务 | 否 | 否 | 否 | 内置 cron |
| 自我改进 | 否 | 否 | 否 | 是,通过技能 + 记忆 |
| 模型绑定 | Anthropic | 多种 | 多种 | 支持 18+ 家提供商,一条命令即可切换 |
| 最佳适用场景 | 在代码库中编码 | 实时内联编写代码 | 运行 Shell 工作流 | 能产生复利效应的长期运行自主任务 |
如何选择
- 选择 Claude Code:当你身处代码库中,需要 Agent 来阅读、编辑代码,运行测试或提交代码时。它是编码专家。
- 选择 Cursor:当你希望在编辑器内实时获得 AI 代码补全和修复时。
- 选择 OpenClaw:当你希望通过可组合的命令声明式地配置任务运行器时。
- 选择 Hermes:当你需要一个具备以下特性的 Agent:(a) 生命周期超越单次会话,(b) 可通过任何渠道与你交流,(c) 随时间推移在你重复性工作上越来越熟练。
运行多个 Agent
社区中大多数人将 Hermes 与 Claude Code 并行运行。Claude Code 负责代码库内的编码工作,Hermes 则处理其他一切:每日简报、监控、自动化、多仓库研究、跨渠道协调。它们并非竞争关系,而是功能互补。
如果你正从 OpenClaw 迁移,Nous 提供了可自动迁移配置的工具,迁移过程几乎无感。
2 分钟完成安装
安装 Hermes 只需一条 curl 命令和两个简单的配置步骤。如果一切顺利,两分钟内即可完成。
前提条件
- macOS、Linux 或 Windows (WSL2)。 纯 Windows 尚未官方支持,请使用 WSL2。
- 一个终端。 任何 Shell 均可 —— bash、zsh、fish。
- 一个 API 密钥或本地模型。 你可以使用 Nous Portal、从模型提供商获取的 API 密钥,或者本地的 Ollama/LM Studio 安装。
- 约 200 MB 磁盘空间 用于安装,外加存储记忆和技能所需的空间。
安装步骤
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | sh
此命令会将 hermes 二进制文件安装到 ~/.hermes/bin/ 目录,并自动将其加入你的 PATH 环境变量。
首次运行
hermes
首次运行时,Hermes 会以交互方式引导你完成提供商设置。根据提示粘贴 API 密钥,或将其指向本地模型。运行 hermes model 命令以确认配置。
验证安装
hermes doctor
该命令会打印一份健康报告。如果全部显示为绿色,则表示已准备就绪。
常见问题
- “Command not found: hermes” → 你的 Shell 未识别新的 PATH。请打开一个新终端,或运行
source ~/.bashrc(或~/.zshrc)。 - “Provider error: invalid key” → 你粘贴的密钥末尾可能有空格,或属于错误的提供商。请重新运行
hermes model并仔细粘贴。 - Windows 上出现 “bad interpreter” → 你正在纯 Windows 环境下运行,而非 WSL2。请在 PowerShell 中安装 WSL2 (
wsl --install),然后在 WSL 内重新运行 curl 安装命令。
选择你的模型
如果 Hermes 在初次使用时感觉卡顿、愚笨或缓慢,问题几乎总是出在模型上。
新手常犯的错误
Hermes 将大量工作委托给模型执行。工具调用、任务规划、技能编写——这些都是模型的责任。小型或较旧的模型无法可靠地调用工具,容易陷入循环或产生无意义输出。因此,Gemma 2B、Llama 3.1 8B 及其他非前沿 (sub-frontier) 模型通常都不是合适的默认选择。 它们可能适用于简单聊天,但难以胜任 Agent 工作流。
成本与能力概览
| 模型 | 价格层级 | 工具调用能力 | 速度 | 最佳适用场景 |
|---|---|---|---|---|
| Claude Sonnet / Opus | $$$ | 极佳 | 快 | 生产环境 Agent 工作流 |
| GPT-5 | $$$ | 极佳 | 快 | 生产环境,OpenAI 技术栈用户 |
| z.AI GLM-5 | $ | 极佳 | 快 | 性价比最高的前沿模型 |
| MiniMax M2.7 | $$ | 极佳 | 快 | 价值出众 |
| DeepSeek | $ | 良好 | 快 | 成本优化型工作流 |
| Nous Portal (订阅制) | $ (固定费用) | 极佳 | 快 | 月度成本可预测 |
| Ollama + Qwen 2.5 Coder | 免费 (本地) | 良好 | 取决于 GPU | 离线编码,隐私敏感型工作 |
| Ollama + Gemma / Llama 8B | 免费 (本地) | 差 | 取决于 GPU | 仅限聊天;不适用于 Agent 工作 |
本地模型 vs. 前沿模型
- 本地模型适用场景: 起草代码片段、简单聊天或运行单次摘要任务。Ollama + Qwen 2.5 Coder 32B 可满足 80% 的日常 CLI 使用需求。
- 本地模型不适用场景: 需要多步工具调用的复杂任务(如监控网站、调用 API、汇总信息并发布到 Telegram)。此时容易遇到循环、超时或工具参数错误等问题,应切换至前沿模型 API。
便捷之选:Nous Portal
如果你不想管理多个提供商的 API 密钥,Nous Portal 提供单一订阅服务,通过一次认证即可使用 Claude、GPT、GLM、MiniMax、Nous 自有模型等众多模型。你只需支付固定月费,无需再操心密钥对应关系。
你的第一个工作流
请从以下示例中选择一个并立即尝试。每个示例耗时 10 到 30 分钟,能帮助你了解 Hermes 的不同方面。
示例 1:编码助手
cd ~/projects/my-repo
hermes
> 审计这个代码库中的死代码、未使用的导入以及超过 6 个月的注释代码块。生成一份 Markdown 报告。
Hermes 会读取文件、运行 grep 命令,并将报告写入 ./hermes-output/ 目录。当你第二次提出类似请求时,速度会更快,因为它已经编写了一个名为 repo-audit 的技能。
示例 2:在 VPS 上部署 Telegram 机器人
在任何廉价的 Linux VPS 上执行:
## 安装 Hermes
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | sh
## 设置 Telegram 网关
hermes gateway setup
## 粘贴从 @BotFather 获取的机器人Token
## 粘贴你的数字 Telegram 用户 ID(可使用 @userinfobot 获取)
## 启动守护进程
hermes daemon start
然后给你的机器人发送消息:
> 每天早上 8 点,汇总我的 GitHub 通知并在这里发送给我
示例 3:每日定时简报
hermes
> 每个工作日早上 7:30,收集:(1) 昨晚排名前 10 的 HN 帖子,(2) 我未读的 GitHub 通知,(3) 西雅图的天气。以纯文本邮件形式发送到 me@example.com。
Hermes 会安排好定时任务并开始执行。
学习循环
如果你理解了学习循环,就明白了 Hermes 为何如此设计。
Hermes 如何随时间进步
每完成一项任务后,Hermes 都会进行一次简短的回顾:任务成功了吗?哪些环节耗时过长?是否存在可重用的模式? 当答案肯定时,它会编写新技能或更新记忆。下次你提出类似请求时,Hermes 会优先调用已有技能,从而跳过重新探索的过程。
有界记忆
记忆存储在三个位置:
MEMORY.md—— 短期记忆,最大容量约 2,200 字符。存储当前关注焦点。USER.md—— 关于你的事实,最大容量约 1,375 字符。存储偏好和约束条件。- 会话搜索 —— 所有过往对话都可通过全文索引进行搜索。
设置容量限制是刻意为之,旨在强制整合信息,保持工作上下文的紧凑高效。
技能:可执行流程
一个技能是位于 ~/.hermes/skills/<技能名>/SKILL.md 的 Markdown 文件,其中描述了:
- 何时触发该技能。
- 如何运行它(包含指令和工具调用)。
- 运行所需的上下文信息。
5 次工具调用规则
当 Hermes 检测到重复模式时便会生成技能:通常是在同一模式上进行了五次以上的工具调用后,或者在用户进行了一次具有普遍指导意义的纠正后。
Harness Engineering 详解
大语言模型 (LLM) 是一个可替换的组件。真正的工程体现在围绕它的五个层面:指令、约束、反馈、记忆和编排。Hermes 是对这五个层面的一种高度集成且富有主见的实现。
建议首批安装的核心技能
技能中心
运行 hermes skills browse 可查看技能目录。技能分为四个信任等级:内置 (Builtin)、官方 (Official)、受信任 (Trusted) 和社区 (Community)。
前五名推荐技能
- LLM Wiki (内置) —— 任何主题的浓缩参考资料。
- gstack (受信任) —— 浏览器自动化与 QA 测试。
- OpenAI taps (受信任) —— 将 OpenAI 的函数调用原语暴露为 Hermes 工具。
- Manim (官方) —— 根据文本生成数学动画。
- security-audit (官方) —— 扫描代码库中的常见安全漏洞。
安装命令:hermes skills install <技能名>
浏览技能中心
hermes skills browse # 交互式浏览
hermes skills search telegram # 关键词搜索
hermes skills info <技能名> # 安装前查看详细信息
后续学习路径
路径 1:深入探索 Agent
构建一个多 Agent 团队。例如,一个编排者、一个研究员、一个写作者、一个调试者,每个 Agent 都拥有独立的记忆和技能。
路径 2:深入探索工具链
开发你自己的工具和技能。学习 MCP 协议,使你的 Hermes 实例能够与 Notion、Linear、Figma 以及你的内部 API 进行交互。
路径 3:深入探索基础设施
使用 Docker、systemd 或 Kubernetes 为团队在生产环境中部署和运行 Hermes。
收藏 Atlas
Atlas 是你寻找特定工作所需工具的地方,所有项目都经过排名、筛选和安全审查。浏览全部 93 个项目 →。
常见问题解答
Hermes Agent 是免费的吗? Hermes 本身是免费且开源的(采用 MIT 许可证)。你只需为你所使用的模型 API 付费。
它支持 Windows 吗? 支持,但需要通过 WSL2。纯 Windows 环境尚未官方支持。
可以完全离线运行吗? 可以。将其与 Ollama 或 LM Studio 等本地模型配合使用即可。请注意,本地模型在处理复杂工具调用时能力较弱。
需要 GPU 吗? 如果使用 API 提供商,则不需要 GPU。只有在本地运行模型时才需要 GPU。
我的数据会被发送到哪里? 数据只会发送到你配置的模型提供商处。Hermes 本身不收集任何遥测或分析数据。所有记忆和技能都存储在你的本地磁盘上。
Hermes 和 Claude Code 必须二选一吗? 不必。它们功能互补。Claude Code 专注于代码库内的编码,而 Hermes 则处理其他所有事务。
Hermes 会干扰我现有的代码吗?
不会。它是增量式的,所有文件都存放在 ~/.hermes/ 目录下。它只会处理你明确指示它操作的文件。
如果它不小心破坏了某些东西怎么办? Hermes 对破坏性操作设有审批策略。所有会话都有日志记录,并且大多数操作都是可逆的。
团队可以共享一个 Hermes Agent 吗? 可以,通过配置文件 (profiles) 实现。每个配置文件都是一个拥有独立状态的隔离实例。
可以配合 Ollama 或 LM Studio 使用吗?
可以。运行 hermes model,选择 “custom OpenAI-compatible endpoint” 选项,然后指向你的本地模型服务器地址即可。
如何更新 Hermes?
hermes update
Hermes 会自动更新自身,并在应用更改前备份你的配置。
- 原文链接: hermesatlas.com/guide...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~