Hermes Agent 全方位入门指南(2026年4月版)

xksimback 发布于 2026-04-21 阅读 532

Hermes Agent 是由 Nous Research 开发的开源 AI 智能体,核心特色在于持久化记忆和自动化的“技能”学习机制。

Hermes Agent 究竟是什么

Hermes Agent 是由 Nous Research 开发的一款开源 AI Agent,它运行在你的本地机器或廉价的 VPS 上,能够跨会话记住所学内容,并在工作中编写自己的可重用技能。它通过 CLI、Telegram、Discord、电子邮件以及许多其他消息平台与你交流。截至 2026-04-20,其 GitHub stars 数已达 104,791,是 2026 年增长最快的开源 Agent。

30 秒速览

你只需一条 curl 命令即可安装 Hermes。选择一个模型提供商(众多热门选项)和一个模型(Claude、GPT-5.4、GLM-5.1、MiniMax,甚至是本地的 Ollama 模型)。然后给它分配一个任务——例如“每天早上 8 点汇总我的 GitHub 通知”,或“帮我调试这个 Python 脚本”,或“监控这个网站,价格下跌时在 Telegram 上提醒我”。

它开始运行,并持续学习。一周后,同样的任务会产生更精炼的输出,因为 Hermes 一直在默默编写技能——那些记录有效方法的小型 Markdown 文件——并将它们应用到后续的运行中。

这就是产品的全部。安装、分配任务,然后让它产生复利效应。

2 分钟详解

大多数 AI 工具是无状态的:你打开聊天窗口,提出问题,关闭标签页,下一次会话又从头开始。Hermes 颠覆了这一点。它常驻于个人电脑或虚拟专用服务器 (VPS) 上,拥有持久化内存。每当它弄明白某件事,就会创建技能——即可重复使用的流程。它可以通过你偏好的任何渠道联系你:终端、Telegram 机器人、定时任务 (cron job)、Webhook。

其核心架构理念是 Harness Engineering:Nous 认为,2026 年真正的突破并非更智能的模型,而是围绕模型构建的更智能的“包装器”。因此,Hermes 在围绕大语言模型 (LLM) 的五个层面投入巨大——指令、约束、反馈、记忆、编排——并允许你随时更换模型本身。今天用前沿模型,明天换本地模型,明年可能又是别的。

你会听到人们称它为“与你共同成长的 Agent”。这既是 Nous 的宣传语,也是一个有用的心智模型:第一天,Hermes 是一个通用助手;第三十天,它就成了你的助手,融入了三十天学习所得的偏好。

预览:学习循环

每隔几次工具调用,Hermes 就会暂停并自问:刚才发生了什么?哪些做法有效?哪些失败了?这应该转化为一项技能吗? 当答案为“是”时,它会将一个技能文件写入 ~/.hermes/skills/ 目录,供后续使用。这些技能是纯 Markdown 格式,你可以阅读、编辑它们,或删除那些它理解有误的技能。

这是最重要的单一特性,我们将在“学习循环”部分详细展开。

Hermes 适合谁

Hermes 主要吸引三类用户。弄清楚你属于哪一类,有助于理解手册的其余部分。

CLI 开发者

你以终端为家。你已经在使用 Claude Code 或 Cursor 进行编辑器内编码。你需要一个位于编辑器之外的 Agent——一个无需离开 CLI 就能向其发出“审计代码库中的死代码”或“为我们的 0.9 → 0.10 版本升级编写迁移计划”等指令的助手。

你首先会使用的功能: hermes CLI、技能、记忆。暂时可忽略: Telegram、cron、多 Agent。

自动化操作员

你不一定编写代码。你需要一个能在你睡觉时执行重复性工作的 Agent——汇总新闻、监控市场、生成报告、整理收件箱。你会将 Hermes 部署在 Mac Mini 或 5 美元的 VPS 上,并将其连接到你所用的各种消息渠道。

你首先会使用的功能: cron、消息网关、记忆。暂时可忽略: 代码执行、多 Agent。

Telegram 机器人用户

你需要一个可以随时从手机联系的常驻 Agent。无论旅行、开会还是健身,只需给 Hermes 发消息,它就会回应。Telegram 集成是这里的杀手级功能。

你首先会使用的功能: 消息网关、语音、技能。暂时可忽略: 本地 CLI 使用。

你属于哪一类?

如果你想... 从...开始 暂时跳过...
在终端中编写更好的代码 CLI + 技能 Telegram, cron
自动化重复性任务 Cron + 网关 代码执行
从手机与 Agent 聊天 Telegram + 语音 CLI 工作流

这三类用法后续可以共存。建议第一周先专注于一种。

它有何不同

你可能已经在使用 Claude Code、Cursor 或 OpenClaw。那么 Hermes 的定位是什么?

一句话概括

Claude Code 是代码库内的编码 Agent。Cursor 是编辑器内的结对编程助手。OpenClaw 是配置驱动的任务运行器。Hermes 则是一个自我改进的自主 Agent,存在于所有这些工具之外。 大多数高级用户会同时运行其中的两到三个,而非只选一个。

功能对比一览

功能 Claude Code Cursor OpenClaw Hermes Agent
主要界面 代码库内的 CLI IDE CLI + 配置文件 CLI + 聊天 + cron + Telegram
持久化记忆 会话范围 项目范围 基于配置文件 跨会话,有容量限制 (MEMORY.md, USER.md)
学习能力 检测到重复模式后自动生成技能
通信渠道 终端 编辑器 终端 终端, Telegram, Discord, 电子邮件, Webhooks
定时任务 内置 cron
自我改进 是,通过技能 + 记忆
模型绑定 Anthropic 多种 多种 支持 18+ 家提供商,一条命令即可切换
最佳适用场景 在代码库中编码 实时内联编写代码 运行 Shell 工作流 能产生复利效应的长期运行自主任务

如何选择

  • 选择 Claude Code:当你身处代码库中,需要 Agent 来阅读、编辑代码,运行测试或提交代码时。它是编码专家。
  • 选择 Cursor:当你希望在编辑器内实时获得 AI 代码补全和修复时。
  • 选择 OpenClaw:当你希望通过可组合的命令声明式地配置任务运行器时。
  • 选择 Hermes:当你需要一个具备以下特性的 Agent:(a) 生命周期超越单次会话,(b) 可通过任何渠道与你交流,(c) 随时间推移在你重复性工作上越来越熟练。

运行多个 Agent

社区中大多数人将 Hermes Claude Code 并行运行。Claude Code 负责代码库内的编码工作,Hermes 则处理其他一切:每日简报、监控、自动化、多仓库研究、跨渠道协调。它们并非竞争关系,而是功能互补。

如果你正从 OpenClaw 迁移,Nous 提供了可自动迁移配置的工具,迁移过程几乎无感。

2 分钟完成安装

安装 Hermes 只需一条 curl 命令和两个简单的配置步骤。如果一切顺利,两分钟内即可完成。

前提条件

  • macOS、Linux 或 Windows (WSL2)。 纯 Windows 尚未官方支持,请使用 WSL2。
  • 一个终端。 任何 Shell 均可 —— bash、zsh、fish。
  • 一个 API 密钥或本地模型。 你可以使用 Nous Portal、从模型提供商获取的 API 密钥,或者本地的 Ollama/LM Studio 安装。
  • 约 200 MB 磁盘空间 用于安装,外加存储记忆和技能所需的空间。

安装步骤

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | sh

此命令会将 hermes 二进制文件安装到 ~/.hermes/bin/ 目录,并自动将其加入你的 PATH 环境变量。

首次运行

hermes

首次运行时,Hermes 会以交互方式引导你完成提供商设置。根据提示粘贴 API 密钥,或将其指向本地模型。运行 hermes model 命令以确认配置。

验证安装

hermes doctor

该命令会打印一份健康报告。如果全部显示为绿色,则表示已准备就绪。

常见问题

  1. “Command not found: hermes” → 你的 Shell 未识别新的 PATH。请打开一个新终端,或运行 source ~/.bashrc(或 ~/.zshrc)。
  2. “Provider error: invalid key” → 你粘贴的密钥末尾可能有空格,或属于错误的提供商。请重新运行 hermes model 并仔细粘贴。
  3. Windows 上出现 “bad interpreter” → 你正在纯 Windows 环境下运行,而非 WSL2。请在 PowerShell 中安装 WSL2 (wsl --install),然后在 WSL 内重新运行 curl 安装命令。

选择你的模型

如果 Hermes 在初次使用时感觉卡顿、愚笨或缓慢,问题几乎总是出在模型上。

新手常犯的错误

Hermes 将大量工作委托给模型执行。工具调用、任务规划、技能编写——这些都是模型的责任。小型或较旧的模型无法可靠地调用工具,容易陷入循环或产生无意义输出。因此,Gemma 2B、Llama 3.1 8B 及其他非前沿 (sub-frontier) 模型通常都不是合适的默认选择。 它们可能适用于简单聊天,但难以胜任 Agent 工作流。

成本与能力概览

模型 价格层级 工具调用能力 速度 最佳适用场景
Claude Sonnet / Opus $$$ 极佳 生产环境 Agent 工作流
GPT-5 $$$ 极佳 生产环境,OpenAI 技术栈用户
z.AI GLM-5 $ 极佳 性价比最高的前沿模型
MiniMax M2.7 $$ 极佳 价值出众
DeepSeek $ 良好 成本优化型工作流
Nous Portal (订阅制) $ (固定费用) 极佳 月度成本可预测
Ollama + Qwen 2.5 Coder 免费 (本地) 良好 取决于 GPU 离线编码,隐私敏感型工作
Ollama + Gemma / Llama 8B 免费 (本地) 取决于 GPU 仅限聊天;不适用于 Agent 工作

本地模型 vs. 前沿模型

  • 本地模型适用场景: 起草代码片段、简单聊天或运行单次摘要任务。Ollama + Qwen 2.5 Coder 32B 可满足 80% 的日常 CLI 使用需求。
  • 本地模型不适用场景: 需要多步工具调用的复杂任务(如监控网站、调用 API、汇总信息并发布到 Telegram)。此时容易遇到循环、超时或工具参数错误等问题,应切换至前沿模型 API。

便捷之选:Nous Portal

如果你不想管理多个提供商的 API 密钥,Nous Portal 提供单一订阅服务,通过一次认证即可使用 Claude、GPT、GLM、MiniMax、Nous 自有模型等众多模型。你只需支付固定月费,无需再操心密钥对应关系。

你的第一个工作流

请从以下示例中选择一个并立即尝试。每个示例耗时 10 到 30 分钟,能帮助你了解 Hermes 的不同方面。

示例 1:编码助手

cd ~/projects/my-repo
hermes
> 审计这个代码库中的死代码、未使用的导入以及超过 6 个月的注释代码块。生成一份 Markdown 报告。

Hermes 会读取文件、运行 grep 命令,并将报告写入 ./hermes-output/ 目录。当你第二次提出类似请求时,速度会更快,因为它已经编写了一个名为 repo-audit 的技能。

示例 2:在 VPS 上部署 Telegram 机器人

在任何廉价的 Linux VPS 上执行:

## 安装 Hermes
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | sh

## 设置 Telegram 网关
hermes gateway setup
## 粘贴从 @BotFather 获取的机器人Token
## 粘贴你的数字 Telegram 用户 ID(可使用 @userinfobot 获取)

## 启动守护进程
hermes daemon start

然后给你的机器人发送消息: > 每天早上 8 点,汇总我的 GitHub 通知并在这里发送给我

示例 3:每日定时简报

hermes
> 每个工作日早上 7:30,收集:(1) 昨晚排名前 10 的 HN 帖子,(2) 我未读的 GitHub 通知,(3) 西雅图的天气。以纯文本邮件形式发送到 me@example.com。

Hermes 会安排好定时任务并开始执行。

学习循环

如果你理解了学习循环,就明白了 Hermes 为何如此设计。

Hermes 如何随时间进步

每完成一项任务后,Hermes 都会进行一次简短的回顾:任务成功了吗?哪些环节耗时过长?是否存在可重用的模式? 当答案肯定时,它会编写新技能或更新记忆。下次你提出类似请求时,Hermes 会优先调用已有技能,从而跳过重新探索的过程。

有界记忆

记忆存储在三个位置:

  • MEMORY.md —— 短期记忆,最大容量约 2,200 字符。存储当前关注焦点。
  • USER.md —— 关于你的事实,最大容量约 1,375 字符。存储偏好和约束条件。
  • 会话搜索 —— 所有过往对话都可通过全文索引进行搜索。

设置容量限制是刻意为之,旨在强制整合信息,保持工作上下文的紧凑高效。

技能:可执行流程

一个技能是位于 ~/.hermes/skills/<技能名>/SKILL.md 的 Markdown 文件,其中描述了:

  • 何时触发该技能。
  • 如何运行它(包含指令和工具调用)。
  • 运行所需的上下文信息。

5 次工具调用规则

当 Hermes 检测到重复模式时便会生成技能:通常是在同一模式上进行了五次以上的工具调用后,或者在用户进行了一次具有普遍指导意义的纠正后。

Harness Engineering 详解

大语言模型 (LLM) 是一个可替换的组件。真正的工程体现在围绕它的五个层面:指令、约束、反馈、记忆和编排。Hermes 是对这五个层面的一种高度集成且富有主见的实现。

建议首批安装的核心技能

技能中心

运行 hermes skills browse 可查看技能目录。技能分为四个信任等级:内置 (Builtin)、官方 (Official)、受信任 (Trusted) 和社区 (Community)。

前五名推荐技能

  1. LLM Wiki (内置) —— 任何主题的浓缩参考资料。
  2. gstack (受信任) —— 浏览器自动化与 QA 测试。
  3. OpenAI taps (受信任) —— 将 OpenAI 的函数调用原语暴露为 Hermes 工具。
  4. Manim (官方) —— 根据文本生成数学动画。
  5. security-audit (官方) —— 扫描代码库中的常见安全漏洞。

安装命令:hermes skills install <技能名>

浏览技能中心

hermes skills browse           # 交互式浏览
hermes skills search telegram  # 关键词搜索
hermes skills info <技能名>    # 安装前查看详细信息

后续学习路径

路径 1:深入探索 Agent

构建一个多 Agent 团队。例如,一个编排者、一个研究员、一个写作者、一个调试者,每个 Agent 都拥有独立的记忆和技能。

路径 2:深入探索工具链

开发你自己的工具和技能。学习 MCP 协议,使你的 Hermes 实例能够与 Notion、Linear、Figma 以及你的内部 API 进行交互。

路径 3:深入探索基础设施

使用 Docker、systemd 或 Kubernetes 为团队在生产环境中部署和运行 Hermes。

收藏 Atlas

Atlas 是你寻找特定工作所需工具的地方,所有项目都经过排名、筛选和安全审查。浏览全部 93 个项目 →

常见问题解答

Hermes Agent 是免费的吗? Hermes 本身是免费且开源的(采用 MIT 许可证)。你只需为你所使用的模型 API 付费。

它支持 Windows 吗? 支持,但需要通过 WSL2。纯 Windows 环境尚未官方支持。

可以完全离线运行吗? 可以。将其与 Ollama 或 LM Studio 等本地模型配合使用即可。请注意,本地模型在处理复杂工具调用时能力较弱。

需要 GPU 吗? 如果使用 API 提供商,则不需要 GPU。只有在本地运行模型时才需要 GPU。

我的数据会被发送到哪里? 数据只会发送到你配置的模型提供商处。Hermes 本身不收集任何遥测或分析数据。所有记忆和技能都存储在你的本地磁盘上。

Hermes 和 Claude Code 必须二选一吗? 不必。它们功能互补。Claude Code 专注于代码库内的编码,而 Hermes 则处理其他所有事务。

Hermes 会干扰我现有的代码吗? 不会。它是增量式的,所有文件都存放在 ~/.hermes/ 目录下。它只会处理你明确指示它操作的文件。

如果它不小心破坏了某些东西怎么办? Hermes 对破坏性操作设有审批策略。所有会话都有日志记录,并且大多数操作都是可逆的。

团队可以共享一个 Hermes Agent 吗? 可以,通过配置文件 (profiles) 实现。每个配置文件都是一个拥有独立状态的隔离实例。

可以配合 Ollama 或 LM Studio 使用吗? 可以。运行 hermes model,选择 “custom OpenAI-compatible endpoint” 选项,然后指向你的本地模型服务器地址即可。

如何更新 Hermes?

hermes update

Hermes 会自动更新自身,并在应用更改前备份你的配置。

  • 原文链接: hermesatlas.com/guide...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~

相关文章

0 条评论