Hermes Agent 全方位入门指南（2026年4月版）

xksimback 发布于 2026-04-21 阅读 640

Hermes Agent 是由 Nous Research 开发的开源 AI 智能体，核心特色在于持久化记忆和自动化的“技能”学习机制。

## Hermes Agent 究竟是什么

**Hermes Agent 是由 [Nous Research](https://nousresearch.com/) 开发的一款开源 AI Agent，它运行在你的本地机器或廉价的 VPS 上，能够跨会话记住所学内容，并在工作中编写自己的可重用技能。它通过 CLI、Telegram、Discord、电子邮件以及许多其他消息平台与你交流。截至 2026-04-20，其 GitHub stars 数已达 104,791，是 2026 年增长最快的开源 Agent。**

### 30 秒速览

你只需一条 curl 命令即可安装 Hermes。选择一个模型提供商（众多热门选项）和一个模型（Claude、GPT-5.4、GLM-5.1、MiniMax，甚至是本地的 Ollama 模型）。然后给它分配一个任务——例如“每天早上 8 点汇总我的 GitHub 通知”，或“帮我调试这个 Python 脚本”，或“监控这个网站，价格下跌时在 Telegram 上提醒我”。

它开始运行，并持续学习。一周后，同样的任务会产生更精炼的输出，因为 Hermes 一直在默默编写技能——那些记录有效方法的小型 Markdown 文件——并将它们应用到后续的运行中。

这就是产品的全部。安装、分配任务，然后让它产生复利效应。

### 2 分钟详解

大多数 AI 工具是无状态的：你打开聊天窗口，提出问题，关闭标签页，下一次会话又从头开始。Hermes 颠覆了这一点。它常驻于个人电脑或虚拟专用服务器 (VPS) 上，拥有持久化内存。每当它弄明白某件事，就会创建技能——即可重复使用的流程。它可以通过你偏好的任何渠道联系你：终端、Telegram 机器人、定时任务 (cron job)、Webhook。

其核心架构理念是 **Harness Engineering**：Nous 认为，2026 年真正的突破并非更智能的模型，而是围绕模型构建的更智能的“包装器”。因此，Hermes 在围绕大语言模型 (LLM) 的五个层面投入巨大——指令、约束、反馈、记忆、编排——并允许你随时更换模型本身。今天用前沿模型，明天换本地模型，明年可能又是别的。

你会听到人们称它为“与你共同成长的 Agent”。这既是 Nous 的宣传语，也是一个有用的心智模型：第一天，Hermes 是一个通用助手；第三十天，它就成了**你的**助手，融入了三十天学习所得的偏好。

### 预览：学习循环

每隔几次工具调用，Hermes 就会暂停并自问：**刚才发生了什么？哪些做法有效？哪些失败了？这应该转化为一项技能吗？** 当答案为“是”时，它会将一个技能文件写入 `~/.hermes/skills/` 目录，供后续使用。这些技能是纯 Markdown 格式，你可以阅读、编辑它们，或删除那些它理解有误的技能。

这是最重要的单一特性，我们将在“学习循环”部分详细展开。

## Hermes 适合谁

Hermes 主要吸引三类用户。弄清楚你属于哪一类，有助于理解手册的其余部分。

### CLI 开发者

你以终端为家。你已经在使用 Claude Code 或 Cursor 进行编辑器内编码。你需要一个位于编辑器**之外**的 Agent——一个无需离开 CLI 就能向其发出“审计代码库中的死代码”或“为我们的 0.9 → 0.10 版本升级编写迁移计划”等指令的助手。

**你首先会使用的功能：** `hermes` CLI、技能、记忆。**暂时可忽略：** Telegram、cron、多 Agent。

### 自动化操作员

你不一定编写代码。你需要一个能在你睡觉时执行重复性工作的 Agent——汇总新闻、监控市场、生成报告、整理收件箱。你会将 Hermes 部署在 Mac Mini 或 5 美元的 VPS 上，并将其连接到你所用的各种消息渠道。

**你首先会使用的功能：** cron、消息网关、记忆。**暂时可忽略：** 代码执行、多 Agent。

### Telegram 机器人用户

你需要一个可以随时从手机联系的常驻 Agent。无论旅行、开会还是健身，只需给 Hermes 发消息，它就会回应。Telegram 集成是这里的杀手级功能。

**你首先会使用的功能：** 消息网关、语音、技能。**暂时可忽略：** 本地 CLI 使用。

### 你属于哪一类？

| 如果你想... | 从...开始 | 暂时跳过... |
| --- | --- | --- |
| 在终端中编写更好的代码 | CLI + 技能 | Telegram, cron |
| 自动化重复性任务 | Cron + 网关 | 代码执行 |
| 从手机与 Agent 聊天 | Telegram + 语音 | CLI 工作流 |

这三类用法后续可以共存。建议第一周先专注于一种。

## 它有何不同

你可能已经在使用 Claude Code、Cursor 或 OpenClaw。那么 Hermes 的定位是什么？

### 一句话概括

**Claude Code 是代码库内的编码 Agent。Cursor 是编辑器内的结对编程助手。OpenClaw 是配置驱动的任务运行器。Hermes 则是一个自我改进的自主 Agent，存在于所有这些工具之外。** 大多数高级用户会同时运行其中的两到三个，而非只选一个。

### 功能对比一览

| 功能 | Claude Code | Cursor | OpenClaw | **Hermes Agent** |
| --- | --- | --- | --- | --- |
| 主要界面 | 代码库内的 CLI | IDE | CLI + 配置文件 | CLI + 聊天 + cron + Telegram |
| 持久化记忆 | 会话范围 | 项目范围 | 基于配置文件 | **跨会话，有容量限制 (MEMORY.md, USER.md)** |
| 学习能力 | 无 | 无 | 无 | **检测到重复模式后自动生成技能** |
| 通信渠道 | 终端 | 编辑器 | 终端 | **终端, Telegram, Discord, 电子邮件, Webhooks** |
| 定时任务 | 否 | 否 | 否 | **内置 cron** |
| 自我改进 | 否 | 否 | 否 | **是，通过技能 + 记忆** |
| 模型绑定 | Anthropic | 多种 | 多种 | **支持 18+ 家提供商，一条命令即可切换** |
| 最佳适用场景 | 在代码库中编码 | 实时内联编写代码 | 运行 Shell 工作流 | **能产生复利效应的长期运行自主任务** |

### 如何选择

- **选择 Claude Code**：当你身处代码库中，需要 Agent 来阅读、编辑代码，运行测试或提交代码时。它是编码专家。
- **选择 Cursor**：当你希望在编辑器内实时获得 AI 代码补全和修复时。
- **选择 OpenClaw**：当你希望通过可组合的命令声明式地配置任务运行器时。
- **选择 Hermes**：当你需要一个具备以下特性的 Agent：(a) 生命周期超越单次会话，(b) 可通过任何渠道与你交流，(c) 随时间推移在你重复性工作上越来越熟练。

### 运行多个 Agent

社区中大多数人将 Hermes **与** Claude Code 并行运行。Claude Code 负责代码库内的编码工作，Hermes 则处理其他一切：每日简报、监控、自动化、多仓库研究、跨渠道协调。它们并非竞争关系，而是功能互补。

如果你正从 OpenClaw 迁移，Nous 提供了可自动迁移配置的工具，迁移过程几乎无感。

## 2 分钟完成安装

安装 Hermes 只需一条 curl 命令和两个简单的配置步骤。如果一切顺利，两分钟内即可完成。

### 前提条件

- **macOS、Linux 或 Windows (WSL2)。** 纯 Windows 尚未官方支持，请使用 WSL2。
- **一个终端。** 任何 Shell 均可 —— bash、zsh、fish。
- **一个 API 密钥或本地模型。** 你可以使用 [Nous Portal](https://portal.nousresearch.com/)、从模型提供商获取的 API 密钥，或者本地的 Ollama/LM Studio 安装。
- **约 200 MB 磁盘空间** 用于安装，外加存储记忆和技能所需的空间。

### 安装步骤

```bash
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | sh
```

此命令会将 `hermes` 二进制文件安装到 `~/.hermes/bin/` 目录，并自动将其加入你的 PATH 环境变量。

### 首次运行

```bash
hermes
```

首次运行时，Hermes 会以交互方式引导你完成提供商设置。根据提示粘贴 API 密钥，或将其指向本地模型。运行 `hermes model` 命令以确认配置。

### 验证安装

```bash
hermes doctor
```

该命令会打印一份健康报告。如果全部显示为绿色，则表示已准备就绪。

### 常见问题

1.  **“Command not found: hermes”** → 你的 Shell 未识别新的 PATH。请打开一个新终端，或运行 `source ~/.bashrc`（或 `~/.zshrc`）。
2.  **“Provider error: invalid key”** → 你粘贴的密钥末尾可能有空格，或属于错误的提供商。请重新运行 `hermes model` 并仔细粘贴。
3.  **Windows 上出现 “bad interpreter”** → 你正在纯 Windows 环境下运行，而非 WSL2。请在 PowerShell 中安装 WSL2 (`wsl --install`)，然后在 WSL 内重新运行 curl 安装命令。

## 选择你的模型

如果 Hermes 在初次使用时感觉卡顿、愚笨或缓慢，问题几乎总是出在模型上。

### 新手常犯的错误

Hermes 将大量工作委托给模型执行。工具调用、任务规划、技能编写——这些都是模型的责任。小型或较旧的模型无法可靠地调用工具，容易陷入循环或产生无意义输出。**因此，Gemma 2B、Llama 3.1 8B 及其他非前沿 (sub-frontier) 模型通常都不是合适的默认选择。** 它们可能适用于简单聊天，但难以胜任 Agent 工作流。

### 成本与能力概览

| 模型 | 价格层级 | 工具调用能力 | 速度 | 最佳适用场景 |
| --- | --- | --- | --- | --- |
| Claude Sonnet / Opus | $$$ | 极佳 | 快 | 生产环境 Agent 工作流 |
| GPT-5 | $$$ | 极佳 | 快 | 生产环境，OpenAI 技术栈用户 |
| z.AI GLM-5 | $ | 极佳 | 快 | 性价比最高的前沿模型 |
| MiniMax M2.7 | $$ | 极佳 | 快 | 价值出众 |
| DeepSeek | $ | 良好 | 快 | 成本优化型工作流 |
| Nous Portal (订阅制) | $ (固定费用) | 极佳 | 快 | 月度成本可预测 |
| Ollama + Qwen 2.5 Coder | 免费 (本地) | 良好 | 取决于 GPU | 离线编码，隐私敏感型工作 |
| Ollama + Gemma / Llama 8B | 免费 (本地) | **差** | 取决于 GPU | 仅限聊天；不适用于 Agent 工作 |

### 本地模型 vs. 前沿模型

-   **本地模型适用场景：** 起草代码片段、简单聊天或运行单次摘要任务。Ollama + Qwen 2.5 Coder 32B 可满足 80% 的日常 CLI 使用需求。
-   **本地模型不适用场景：** 需要多步工具调用的复杂任务（如监控网站、调用 API、汇总信息并发布到 Telegram）。此时容易遇到循环、超时或工具参数错误等问题，应切换至前沿模型 API。

### 便捷之选：Nous Portal

如果你不想管理多个提供商的 API 密钥，[Nous Portal](https://portal.nousresearch.com/) 提供单一订阅服务，通过一次认证即可使用 Claude、GPT、GLM、MiniMax、Nous 自有模型等众多模型。你只需支付固定月费，无需再操心密钥对应关系。

## 你的第一个工作流

请从以下示例中选择一个并立即尝试。每个示例耗时 10 到 30 分钟，能帮助你了解 Hermes 的不同方面。

### 示例 1：编码助手

```bash
cd ~/projects/my-repo
hermes
> 审计这个代码库中的死代码、未使用的导入以及超过 6 个月的注释代码块。生成一份 Markdown 报告。
```

Hermes 会读取文件、运行 grep 命令，并将报告写入 `./hermes-output/` 目录。当你第二次提出类似请求时，速度会更快，因为它已经编写了一个名为 `repo-audit` 的技能。

### 示例 2：在 VPS 上部署 Telegram 机器人

在任何廉价的 Linux VPS 上执行：

```bash
## 安装 Hermes
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | sh

## 设置 Telegram 网关
hermes gateway setup
## 粘贴从 @BotFather 获取的机器人Token
## 粘贴你的数字 Telegram 用户 ID（可使用 @userinfobot 获取）

## 启动守护进程
hermes daemon start
```

然后给你的机器人发送消息：
`> 每天早上 8 点，汇总我的 GitHub 通知并在这里发送给我`

### 示例 3：每日定时简报

```bash
hermes
> 每个工作日早上 7:30，收集：(1) 昨晚排名前 10 的 HN 帖子，(2) 我未读的 GitHub 通知，(3) 西雅图的天气。以纯文本邮件形式发送到 me@example.com。
```

Hermes 会安排好定时任务并开始执行。

## 学习循环

如果你理解了学习循环，就明白了 Hermes 为何如此设计。

### Hermes 如何随时间进步

每完成一项任务后，Hermes 都会进行一次简短的回顾：**任务成功了吗？哪些环节耗时过长？是否存在可重用的模式？** 当答案肯定时，它会编写新技能或更新记忆。下次你提出类似请求时，Hermes 会优先调用已有技能，从而跳过重新探索的过程。

### 有界记忆

记忆存储在三个位置：

-   `MEMORY.md` —— 短期记忆，最大容量约 2,200 字符。存储当前关注焦点。
-   `USER.md` —— 关于你的事实，最大容量约 1,375 字符。存储偏好和约束条件。
-   **会话搜索** —— 所有过往对话都可通过全文索引进行搜索。

设置容量限制是刻意为之，旨在强制整合信息，保持工作上下文的紧凑高效。

### 技能：可执行流程

一个技能是位于 `~/.hermes/skills/<技能名>/SKILL.md` 的 Markdown 文件，其中描述了：
-   **何时**触发该技能。
-   **如何**运行它（包含指令和工具调用）。
-   运行所需的**上下文**信息。

### 5 次工具调用规则

当 Hermes 检测到重复模式时便会生成技能：通常是在同一模式上进行了五次以上的工具调用后，或者在用户进行了一次具有普遍指导意义的纠正后。

### Harness Engineering 详解

大语言模型 (LLM) 是一个可替换的组件。真正的工程体现在围绕它的五个层面：指令、约束、反馈、记忆和编排。Hermes 是对这五个层面的一种高度集成且富有主见的实现。

## 建议首批安装的核心技能

### 技能中心

运行 `hermes skills browse` 可查看技能目录。技能分为四个信任等级：内置 (Builtin)、官方 (Official)、受信任 (Trusted) 和社区 (Community)。

### 前五名推荐技能

1.  **LLM Wiki** (内置) —— 任何主题的浓缩参考资料。
2.  **gstack** (受信任) —— 浏览器自动化与 QA 测试。
3.  **OpenAI taps** (受信任) —— 将 OpenAI 的函数调用原语暴露为 Hermes 工具。
4.  **Manim** (官方) —— 根据文本生成数学动画。
5.  **security-audit** (官方) —— 扫描代码库中的常见安全漏洞。

安装命令：`hermes skills install <技能名>`

### 浏览技能中心

```bash
hermes skills browse           # 交互式浏览
hermes skills search telegram  # 关键词搜索
hermes skills info <技能名>    # 安装前查看详细信息
```

## 后续学习路径

### 路径 1：深入探索 Agent

构建一个多 Agent 团队。例如，一个编排者、一个研究员、一个写作者、一个调试者，每个 Agent 都拥有独立的记忆和技能。

### 路径 2：深入探索工具链

开发你自己的工具和技能。学习 MCP 协议，使你的 Hermes 实例能够与 Notion、Linear、Figma 以及你的内部 API 进行交互。

### 路径 3：深入探索基础设施

使用 Docker、systemd 或 Kubernetes 为团队在生产环境中部署和运行 Hermes。

### 收藏 Atlas

Atlas 是你寻找特定工作所需工具的地方，所有项目都经过排名、筛选和安全审查。**[浏览全部 93 个项目 →](https://hermesatlas.com/)**。

## 常见问题解答

**Hermes Agent 是免费的吗？**
Hermes 本身是免费且开源的（采用 MIT 许可证）。你只需为你所使用的模型 API 付费。

**它支持 Windows 吗？**
支持，但需要通过 WSL2。纯 Windows 环境尚未官方支持。

**可以完全离线运行吗？**
可以。将其与 Ollama 或 LM Studio 等本地模型配合使用即可。请注意，本地模型在处理复杂工具调用时能力较弱。

**需要 GPU 吗？**
如果使用 API 提供商，则不需要 GPU。只有在本地运行模型时才需要 GPU。

**我的数据会被发送到哪里？**
数据只会发送到你配置的模型提供商处。Hermes 本身不收集任何遥测或分析数据。所有记忆和技能都存储在你的本地磁盘上。

**Hermes 和 Claude Code 必须二选一吗？**
不必。它们功能互补。Claude Code 专注于代码库内的编码，而 Hermes 则处理其他所有事务。

**Hermes 会干扰我现有的代码吗？**
不会。它是增量式的，所有文件都存放在 `~/.hermes/` 目录下。它只会处理你明确指示它操作的文件。

**如果它不小心破坏了某些东西怎么办？**
Hermes 对破坏性操作设有审批策略。所有会话都有日志记录，并且大多数操作都是可逆的。

**团队可以共享一个 Hermes Agent 吗？**
可以，通过配置文件 (profiles) 实现。每个配置文件都是一个拥有独立状态的隔离实例。

**可以配合 Ollama 或 LM Studio 使用吗？**
可以。运行 `hermes model`，选择 “custom OpenAI-compatible endpoint” 选项，然后指向你的本地模型服务器地址即可。

**如何更新 Hermes？**
```bash
hermes update
```
Hermes 会自动更新自身，并在应用更改前备份你的配置。

>- 原文链接： [hermesatlas.com/guide...](https://hermesatlas.com/guide)
>- 登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

Hermes Agent 究竟是什么

Hermes Agent 是由 Nous Research 开发的一款开源 AI Agent，它运行在你的本地机器或廉价的 VPS 上，能够跨会话记住所学内容，并在工作中编写自己的可重用技能。它通过 CLI、Telegram、Discord、电子邮件以及许多其他消息平台与你交流。截至 2026-04-20，其 GitHub stars 数已达 104,791，是 2026 年增长最快的开源 Agent。

30 秒速览

这就是产品的全部。安装、分配任务，然后让它产生复利效应。

2 分钟详解

其核心架构理念是 Harness Engineering：Nous 认为，2026 年真正的突破并非更智能的模型，而是围绕模型构建的更智能的“包装器”。因此，Hermes 在围绕大语言模型 (LLM) 的五个层面投入巨大——指令、约束、反馈、记忆、编排——并允许你随时更换模型本身。今天用前沿模型，明天换本地模型，明年可能又是别的。

你会听到人们称它为“与你共同成长的 Agent”。这既是 Nous 的宣传语，也是一个有用的心智模型：第一天，Hermes 是一个通用助手；第三十天，它就成了你的助手，融入了三十天学习所得的偏好。

预览：学习循环

每隔几次工具调用，Hermes 就会暂停并自问：刚才发生了什么？哪些做法有效？哪些失败了？这应该转化为一项技能吗？ 当答案为“是”时，它会将一个技能文件写入 ~/.hermes/skills/ 目录，供后续使用。这些技能是纯 Markdown 格式，你可以阅读、编辑它们，或删除那些它理解有误的技能。

这是最重要的单一特性，我们将在“学习循环”部分详细展开。

Hermes 适合谁

Hermes 主要吸引三类用户。弄清楚你属于哪一类，有助于理解手册的其余部分。

CLI 开发者

你以终端为家。你已经在使用 Claude Code 或 Cursor 进行编辑器内编码。你需要一个位于编辑器之外的 Agent——一个无需离开 CLI 就能向其发出“审计代码库中的死代码”或“为我们的 0.9 → 0.10 版本升级编写迁移计划”等指令的助手。

你首先会使用的功能： hermes CLI、技能、记忆。暂时可忽略： Telegram、cron、多 Agent。

自动化操作员

你首先会使用的功能： cron、消息网关、记忆。暂时可忽略： 代码执行、多 Agent。

Telegram 机器人用户

你需要一个可以随时从手机联系的常驻 Agent。无论旅行、开会还是健身，只需给 Hermes 发消息，它就会回应。Telegram 集成是这里的杀手级功能。

你首先会使用的功能： 消息网关、语音、技能。暂时可忽略： 本地 CLI 使用。

你属于哪一类？

如果你想...	从...开始	暂时跳过...
在终端中编写更好的代码	CLI + 技能	Telegram, cron
自动化重复性任务	Cron + 网关	代码执行
从手机与 Agent 聊天	Telegram + 语音	CLI 工作流

这三类用法后续可以共存。建议第一周先专注于一种。

它有何不同

你可能已经在使用 Claude Code、Cursor 或 OpenClaw。那么 Hermes 的定位是什么？

一句话概括

Claude Code 是代码库内的编码 Agent。Cursor 是编辑器内的结对编程助手。OpenClaw 是配置驱动的任务运行器。Hermes 则是一个自我改进的自主 Agent，存在于所有这些工具之外。大多数高级用户会同时运行其中的两到三个，而非只选一个。

功能对比一览

功能	Claude Code	Cursor	OpenClaw	Hermes Agent
主要界面	代码库内的 CLI	IDE	CLI + 配置文件	CLI + 聊天 + cron + Telegram
持久化记忆	会话范围	项目范围	基于配置文件	跨会话，有容量限制 (MEMORY.md, USER.md)
学习能力	无	无	无	检测到重复模式后自动生成技能
通信渠道	终端	编辑器	终端	终端, Telegram, Discord, 电子邮件, Webhooks
定时任务	否	否	否	内置 cron
自我改进	否	否	否	是，通过技能 + 记忆
模型绑定	Anthropic	多种	多种	支持 18+ 家提供商，一条命令即可切换
最佳适用场景	在代码库中编码	实时内联编写代码	运行 Shell 工作流	能产生复利效应的长期运行自主任务

如何选择

选择 Claude Code：当你身处代码库中，需要 Agent 来阅读、编辑代码，运行测试或提交代码时。它是编码专家。
选择 Cursor：当你希望在编辑器内实时获得 AI 代码补全和修复时。
选择 OpenClaw：当你希望通过可组合的命令声明式地配置任务运行器时。
选择 Hermes：当你需要一个具备以下特性的 Agent：(a) 生命周期超越单次会话，(b) 可通过任何渠道与你交流，(c) 随时间推移在你重复性工作上越来越熟练。

运行多个 Agent

社区中大多数人将 Hermes 与 Claude Code 并行运行。Claude Code 负责代码库内的编码工作，Hermes 则处理其他一切：每日简报、监控、自动化、多仓库研究、跨渠道协调。它们并非竞争关系，而是功能互补。

如果你正从 OpenClaw 迁移，Nous 提供了可自动迁移配置的工具，迁移过程几乎无感。

2 分钟完成安装

安装 Hermes 只需一条 curl 命令和两个简单的配置步骤。如果一切顺利，两分钟内即可完成。

前提条件

macOS、Linux 或 Windows (WSL2)。 纯 Windows 尚未官方支持，请使用 WSL2。
一个终端。 任何 Shell 均可 —— bash、zsh、fish。
一个 API 密钥或本地模型。 你可以使用 Nous Portal、从模型提供商获取的 API 密钥，或者本地的 Ollama/LM Studio 安装。
约 200 MB 磁盘空间 用于安装，外加存储记忆和技能所需的空间。

安装步骤

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | sh

此命令会将 hermes 二进制文件安装到 ~/.hermes/bin/ 目录，并自动将其加入你的 PATH 环境变量。

首次运行

hermes

首次运行时，Hermes 会以交互方式引导你完成提供商设置。根据提示粘贴 API 密钥，或将其指向本地模型。运行 hermes model 命令以确认配置。

验证安装

hermes doctor

该命令会打印一份健康报告。如果全部显示为绿色，则表示已准备就绪。

常见问题

“Command not found: hermes” → 你的 Shell 未识别新的 PATH。请打开一个新终端，或运行 source ~/.bashrc（或 ~/.zshrc）。
“Provider error: invalid key” → 你粘贴的密钥末尾可能有空格，或属于错误的提供商。请重新运行 hermes model 并仔细粘贴。
Windows 上出现 “bad interpreter” → 你正在纯 Windows 环境下运行，而非 WSL2。请在 PowerShell 中安装 WSL2 (wsl --install)，然后在 WSL 内重新运行 curl 安装命令。

选择你的模型

如果 Hermes 在初次使用时感觉卡顿、愚笨或缓慢，问题几乎总是出在模型上。

新手常犯的错误

Hermes 将大量工作委托给模型执行。工具调用、任务规划、技能编写——这些都是模型的责任。小型或较旧的模型无法可靠地调用工具，容易陷入循环或产生无意义输出。因此，Gemma 2B、Llama 3.1 8B 及其他非前沿 (sub-frontier) 模型通常都不是合适的默认选择。 它们可能适用于简单聊天，但难以胜任 Agent 工作流。

成本与能力概览

模型	价格层级	工具调用能力	速度	最佳适用场景
Claude Sonnet / Opus	$$$	极佳	快	生产环境 Agent 工作流
GPT-5	$$$	极佳	快	生产环境，OpenAI 技术栈用户
z.AI GLM-5	$	极佳	快	性价比最高的前沿模型
MiniMax M2.7	$$	极佳	快	价值出众
DeepSeek	$	良好	快	成本优化型工作流
Nous Portal (订阅制)	$ (固定费用)	极佳	快	月度成本可预测
Ollama + Qwen 2.5 Coder	免费 (本地)	良好	取决于 GPU	离线编码，隐私敏感型工作
Ollama + Gemma / Llama 8B	免费 (本地)	差	取决于 GPU	仅限聊天；不适用于 Agent 工作

本地模型 vs. 前沿模型

本地模型适用场景： 起草代码片段、简单聊天或运行单次摘要任务。Ollama + Qwen 2.5 Coder 32B 可满足 80% 的日常 CLI 使用需求。
本地模型不适用场景： 需要多步工具调用的复杂任务（如监控网站、调用 API、汇总信息并发布到 Telegram）。此时容易遇到循环、超时或工具参数错误等问题，应切换至前沿模型 API。

便捷之选：Nous Portal

如果你不想管理多个提供商的 API 密钥，Nous Portal 提供单一订阅服务，通过一次认证即可使用 Claude、GPT、GLM、MiniMax、Nous 自有模型等众多模型。你只需支付固定月费，无需再操心密钥对应关系。

你的第一个工作流

请从以下示例中选择一个并立即尝试。每个示例耗时 10 到 30 分钟，能帮助你了解 Hermes 的不同方面。

示例 1：编码助手

cd ~/projects/my-repo
hermes
> 审计这个代码库中的死代码、未使用的导入以及超过 6 个月的注释代码块。生成一份 Markdown 报告。

Hermes 会读取文件、运行 grep 命令，并将报告写入 ./hermes-output/ 目录。当你第二次提出类似请求时，速度会更快，因为它已经编写了一个名为 repo-audit 的技能。

示例 2：在 VPS 上部署 Telegram 机器人

在任何廉价的 Linux VPS 上执行：

## 安装 Hermes
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | sh

## 设置 Telegram 网关
hermes gateway setup
## 粘贴从 @BotFather 获取的机器人Token
## 粘贴你的数字 Telegram 用户 ID（可使用 @userinfobot 获取）

## 启动守护进程
hermes daemon start

然后给你的机器人发送消息： > 每天早上 8 点，汇总我的 GitHub 通知并在这里发送给我

示例 3：每日定时简报

hermes
> 每个工作日早上 7:30，收集：(1) 昨晚排名前 10 的 HN 帖子，(2) 我未读的 GitHub 通知，(3) 西雅图的天气。以纯文本邮件形式发送到 me@example.com。

Hermes 会安排好定时任务并开始执行。

学习循环

如果你理解了学习循环，就明白了 Hermes 为何如此设计。

Hermes 如何随时间进步

每完成一项任务后，Hermes 都会进行一次简短的回顾：任务成功了吗？哪些环节耗时过长？是否存在可重用的模式？ 当答案肯定时，它会编写新技能或更新记忆。下次你提出类似请求时，Hermes 会优先调用已有技能，从而跳过重新探索的过程。

有界记忆

记忆存储在三个位置：

MEMORY.md —— 短期记忆，最大容量约 2,200 字符。存储当前关注焦点。
USER.md —— 关于你的事实，最大容量约 1,375 字符。存储偏好和约束条件。
会话搜索 —— 所有过往对话都可通过全文索引进行搜索。

设置容量限制是刻意为之，旨在强制整合信息，保持工作上下文的紧凑高效。

技能：可执行流程

一个技能是位于 ~/.hermes/skills/<技能名>/SKILL.md 的 Markdown 文件，其中描述了：

何时触发该技能。
如何运行它（包含指令和工具调用）。
运行所需的上下文信息。

5 次工具调用规则

当 Hermes 检测到重复模式时便会生成技能：通常是在同一模式上进行了五次以上的工具调用后，或者在用户进行了一次具有普遍指导意义的纠正后。

Harness Engineering 详解

建议首批安装的核心技能

技能中心

运行 hermes skills browse 可查看技能目录。技能分为四个信任等级：内置 (Builtin)、官方 (Official)、受信任 (Trusted) 和社区 (Community)。

前五名推荐技能

LLM Wiki (内置) —— 任何主题的浓缩参考资料。
gstack (受信任) —— 浏览器自动化与 QA 测试。
OpenAI taps (受信任) —— 将 OpenAI 的函数调用原语暴露为 Hermes 工具。
Manim (官方) —— 根据文本生成数学动画。
security-audit (官方) —— 扫描代码库中的常见安全漏洞。

安装命令：hermes skills install <技能名>

浏览技能中心

hermes skills browse           # 交互式浏览
hermes skills search telegram  # 关键词搜索
hermes skills info &lt;技能名>    # 安装前查看详细信息

后续学习路径

路径 1：深入探索 Agent

构建一个多 Agent 团队。例如，一个编排者、一个研究员、一个写作者、一个调试者，每个 Agent 都拥有独立的记忆和技能。

路径 2：深入探索工具链

开发你自己的工具和技能。学习 MCP 协议，使你的 Hermes 实例能够与 Notion、Linear、Figma 以及你的内部 API 进行交互。

路径 3：深入探索基础设施

使用 Docker、systemd 或 Kubernetes 为团队在生产环境中部署和运行 Hermes。

收藏 Atlas

Atlas 是你寻找特定工作所需工具的地方，所有项目都经过排名、筛选和安全审查。浏览全部 93 个项目 →。

常见问题解答

Hermes Agent 是免费的吗？ Hermes 本身是免费且开源的（采用 MIT 许可证）。你只需为你所使用的模型 API 付费。

它支持 Windows 吗？ 支持，但需要通过 WSL2。纯 Windows 环境尚未官方支持。

可以完全离线运行吗？ 可以。将其与 Ollama 或 LM Studio 等本地模型配合使用即可。请注意，本地模型在处理复杂工具调用时能力较弱。

需要 GPU 吗？ 如果使用 API 提供商，则不需要 GPU。只有在本地运行模型时才需要 GPU。

我的数据会被发送到哪里？ 数据只会发送到你配置的模型提供商处。Hermes 本身不收集任何遥测或分析数据。所有记忆和技能都存储在你的本地磁盘上。

Hermes 和 Claude Code 必须二选一吗？ 不必。它们功能互补。Claude Code 专注于代码库内的编码，而 Hermes 则处理其他所有事务。

Hermes 会干扰我现有的代码吗？ 不会。它是增量式的，所有文件都存放在 ~/.hermes/ 目录下。它只会处理你明确指示它操作的文件。

如果它不小心破坏了某些东西怎么办？ Hermes 对破坏性操作设有审批策略。所有会话都有日志记录，并且大多数操作都是可逆的。

团队可以共享一个 Hermes Agent 吗？ 可以，通过配置文件 (profiles) 实现。每个配置文件都是一个拥有独立状态的隔离实例。

可以配合 Ollama 或 LM Studio 使用吗？ 可以。运行 hermes model，选择 “custom OpenAI-compatible endpoint” 选项，然后指向你的本地模型服务器地址即可。

如何更新 Hermes？

hermes update

Hermes 会自动更新自身，并在应用更改前备份你的配置。

原文链接： hermesatlas.com/guide...

登链社区 AI 助手，为大家转译优秀英文文章，如有翻译不通的地方，还请包涵～

0 条评论

Hermes Agent 究竟是什么

30 秒速览

2 分钟详解

预览：学习循环

Hermes 适合谁

CLI 开发者

自动化操作员

Telegram 机器人用户

你属于哪一类？

它有何不同

一句话概括

功能对比一览

如何选择

运行多个 Agent

2 分钟完成安装

前提条件

安装步骤

首次运行

验证安装

常见问题

选择你的模型

新手常犯的错误

成本与能力概览

本地模型 vs. 前沿模型

便捷之选：Nous Portal

你的第一个工作流

示例 1：编码助手

示例 2：在 VPS 上部署 Telegram 机器人

示例 3：每日定时简报

学习循环

Hermes 如何随时间进步

有界记忆

技能：可执行流程

5 次工具调用规则

Harness Engineering 详解

建议首批安装的核心技能

技能中心

前五名推荐技能

浏览技能中心

后续学习路径

路径 1：深入探索 Agent

路径 2：深入探索工具链

路径 3：深入探索基础设施

收藏 Atlas

常见问题解答

相关文章

0 条评论