Hermes Agent 深度指南：一个会“自我进化“的 AI Agent，通俗易懂全解析

技能（Skill）就是 Agent 从经验中自动提取的可复用操作流程。打个比方：你第一次让 AI “部署一个 Node.js 应用到服务器”，它可能需要 10 步才能完成。做完后，它会自动创建一个技能。下次你说"部署 Node.js"，它直接调用技能，3 步搞定。hermes gateway setup # 配置网关（绑定 Telegram Bot 等） hermes gateway start

行走的陀螺仪

320人浏览 · 2026-05-20 13:40:54

行走的陀螺仪 · 2026-05-20 13:40:54 发布

Hermes Agent 深度指南：一个会"自我进化"的 AI Agent，通俗易懂全解析

写在前面：如果你觉得现在的 AI 助手"只会聊天、不会干活"，或者"每次对话都要从头教它"，那 Hermes Agent 绝对值得你了解。它不仅能调用工具、执行任务，还能记住你、积累经验、自我改进——是目前唯一内置"学习闭环"的 AI Agent。本文用最通俗的语言，带你从零搞懂它。

一、Hermes Agent 是什么？一句话说清楚

Hermes Agent 是由 Nous Research 开源的 AI 智能体（Agent），用一句话概括：

它是一个"越用越聪明"的 AI 助手——会自动从经验中学习技能、改进技能、记住你的习惯，还能在 Telegram/Discord/Slack 等平台上随时为你服务。

你可以把它想象成一个有记忆的、能自我成长的 AI 员工：

🧠 有记忆：它记得你是谁、你上次让它做了什么
📚 会学习：完成复杂任务后，自动总结成"技能"，下次直接复用
🔧 能干活：40+ 内置工具，能操作文件、搜索网页、执行代码、管理服务器……
📱 随处可用：终端、Telegram、Discord、Slack、WhatsApp、Signal 都能用
💰 成本低：支持 200+ 种模型，可以在 $5 的 VPS 上运行，空闲时几乎不花钱

二、为什么说它是"自我进化"的 Agent？

市面上大部分 AI Agent 的工作流程是：

用户提问 → LLM 思考 → 调用工具 → 返回结果 → 结束（啥也没记住）

Hermes Agent 不一样，它有一个闭环学习系统：

用户提问 → LLM 思考 → 调用工具 → 返回结果
                                    ↓
                        经验够丰富吗？── 是 ──→ 自动创建"技能"
                                    ↓
                        下次遇到类似任务 → 直接用技能（更快更准）
                                    ↓
                        技能使用中 → 发现可以改进？→ 自动优化技能
                                    ↓
                        定期"自省" → 把重要信息存入持久记忆
                                    ↓
                        跨会话搜索 → 能找到你几周前的对话上下文
                                    ↓
                        用户建模 → 越来越了解你的偏好和习惯

2.1 五大"自我进化"能力详解

能力	通俗解释	举个例子
技能自动创建	完成复杂任务后，自动把步骤总结成可复用的"技能"	你让它部署一个网站，它做完后自动生成一个"deploy-website"技能
技能自我改进	技能在使用过程中会被自动优化	"deploy-website"技能用了三次后，它自己发现可以加个缓存步骤
定期自省	Agent 会主动提醒自己把重要信息存下来	它会自动把"这个用户喜欢用pnpm而不是npm"记下来
跨会话搜索	能搜索过去的对话记录，用 LLM 总结上下文	你问"上次那个React项目的部署命令是啥"，它能找到两周前的对话
用户建模	通过 Honcho 系统建立你的偏好画像	它逐渐知道你是个前端开发者、偏好 TypeScript、习惯用 VS Code

三、核心特性一览

Hermes Agent 不是普通的聊天机器人，它有这些硬核能力：

3.1 真正的终端界面

不是简单的命令行一问一答，而是一个全功能 TUI（终端用户界面）：

✅ 多行编辑
✅ 斜杠命令自动补全
✅ 对话历史浏览
✅ 中断并重定向（干到一半可以改需求）
✅ 工具输出实时流式显示

3.2 随处部署，不限平台

Hermes 的设计理念是：AI 不应该绑在你的电脑上。

                    ┌─── Telegram ────┐
                    │                  │
用户 ──── 任意设备 ───┼─── Discord ─────┼────► Hermes Agent ──── 后端服务
                    │                  │         (云端/本地)
                    ├─── Slack ────────┤
                    │                  │
                    ├─── WhatsApp ─────┤
                    │                  │
                    ├─── Signal ───────┤
                    │                  │
                    └─── CLI 终端 ─────┘

你可以在 Telegram 上发语音消息，它会自动转文字并执行。在地铁上用手机让 AI 帮你处理服务器问题，完全没问题。

3.3 定时任务

内置 cron 调度器，可以用自然语言设置定时任务：

# 在对话中直接说：
"每天早上9点给我发一份服务器状态报告"
"每周五下午5点备份数据库"
"每天凌晨2点检查网站是否正常"

它会自动创建 cron 任务，结果推送到你指定的平台（Telegram/Discord/邮箱等）。

3.4 子代理 & 并行任务

可以派生子代理，让多个任务并行执行：

你："帮我同时做三件事：
     1. 搜索最新的 React 19 变化
     2. 检查服务器的磁盘空间
     3. 写一个 Python 脚本处理 CSV"

Hermes：├── 子代理 A：搜索 React 19 变更
        ├── 子代理 B：SSH 到服务器检查磁盘
        └── 子代理 C：编写 Python 脚本
                    ↓
        全部完成后，汇总结果给你

3.5 灵活的模型支持

不绑定任何一家模型供应商，想用哪个用哪个：

供应商	说明
Nous Portal	Nous Research 自家平台
OpenRouter	200+ 种模型可选
NovitaAI	AI 原生云平台
NVIDIA NIM	Nemotron 等模型
小米 MiMo	小米 AI 平台
z.ai/GLM	智谱 AI
Kimi/Moonshot	月之暗面
MiniMax	MiniMax
Hugging Face	开源模型
OpenAI	GPT 系列
自定义端点	你的私有模型

切换模型只需一行命令：

hermes model    # 交互式选择模型

四、安装教程（手把手教你）

4.1 Linux / macOS / WSL2（推荐）

一行命令搞定：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装完成后：

source ~/.bashrc    # 刷新环境变量（zsh 用户用 source ~/.zshrc）
hermes              # 启动！

4.2 Windows 原生（PowerShell，早期 Beta）

iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

⚠️ Windows 原生支持还在早期测试阶段。如果遇到问题，推荐用 WSL2 方式安装（即用 Linux 那行命令）。

安装器会自动处理：Python 3.11、Node.js、ripgrep、ffmpeg，以及一个便携版 Git Bash（约 45MB，不需要管理员权限，不影响系统 Git）。

4.3 Android / Termux

参考官方文档中的 Termux 指南。

4.4 Docker 部署

Hermes 支持七种终端后端：

后端	适用场景
Local	本地开发
Docker	容器化部署
SSH	远程服务器
Singularity	HPC 集群
Modal	Serverless（按需计费）
Daytona	Serverless 开发环境
Vercel Sandbox	边缘计算

💡 省钱技巧：用 Modal 或 Daytona 的 serverless 模式，空闲时几乎不花钱，有请求时自动唤醒。

五、快速上手（5 分钟从安装到对话）

5.1 基础设置

hermes setup        # 运行完整设置向导（配置模型、工具等）
hermes model        # 选择 LLM 提供商和模型
hermes tools        # 配置启用的工具
hermes config set   # 设置单个配置项

5.2 开始对话

hermes              # 启动交互式终端

进入后你会看到一个漂亮的 TUI 界面，直接打字就能聊天。

5.3 常用命令速查

命令	作用	通俗理解
`/new` 或 `/reset`	开始新对话	“把之前的上下文清空，重新开始”
`/model`	切换模型	“换个大脑”
`/personality`	设置人格	“让 AI 扮演某个角色”
`/retry`	重试上一轮	“刚才的回答不满意，再来一次”
`/undo`	撤销上一轮	“假装上一轮没发生”
`/compress`	压缩上下文	“总结一下之前的对话，省点 token”
`/skills`	浏览技能	“看看我学会了哪些技能”
`/stop`	中断当前任务	“停下！我有新想法”
`/usage`	查看 token 用量	“看看花了多少钱”

六、技能系统：Hermes 的"肌肉记忆"

这是 Hermes Agent 最与众不同的特性，值得单独用一章讲。

6.1 什么是"技能"？

技能（Skill）就是 Agent 从经验中自动提取的可复用操作流程。

打个比方：

你第一次让 AI “部署一个 Node.js 应用到服务器”，它可能需要 10 步才能完成。
做完后，它会自动创建一个 deploy-nodejs 技能。
下次你说"部署 Node.js"，它直接调用技能，3 步搞定。

6.2 技能的生命周期

初次使用 ──→ 任务完成 ──→ 经验足够？
                            │
                是 ◄─────────┘
                │
                ▼
        自动创建技能文件
        (保存到 ~/.hermes/skills/)
                │
                ▼
        下次遇到类似任务
                │
                ▼
        直接调用技能（省去思考时间）
                │
                ▼
        使用过程中发现改进点？
                │
                是
                ▼
        自动优化技能内容

6.3 技能市场（Skills Hub）

Hermes 还有一个开放的技能市场：agentskills.io

🔍 搜索别人分享的技能
📦 一键安装社区技能
🎁 分享你自己创建的技能
📋 兼容 agentskills.io 开放标准

七、记忆系统：Hermes 的"大脑"

7.1 持久记忆

Hermes 的记忆不是"聊完就忘"，而是跨会话持久化的：

今天你告诉它："我喜欢用 TypeScript"
     ↓
明天你开新对话，它已经知道了
     ↓
一周后你让它写代码，它默认就用 TypeScript

7.2 用户画像（Honcho）

Hermes 使用 Honcho 系统进行用户建模：

第 1 次对话："我是做前端的"
  → 记录：用户职业 = 前端开发

第 5 次对话："帮我用 React 写个组件"
  → 强化：前端 + React

第 20 次对话："这个组件用 Tailwind 好看"
  → 补充：偏好 Tailwind CSS

结果：它已经完全了解你的技术栈和偏好了

7.3 会话搜索

使用 FTS5（全文搜索引擎）+ LLM 摘要：

你："两周前我让你分析的那个 Python 性能问题，结论是什么？"

Hermes：→ 搜索历史会话
        → 找到相关对话
        → LLM 总结上下文
        → "你当时那个 Flask 接口慢的原因是数据库查询没加索引……"

八、消息网关：让 AI 活在你的聊天软件里

8.1 什么是消息网关？

消息网关（Messaging Gateway）让 Hermes 连接到你的聊天平台：

hermes gateway setup    # 配置网关（绑定 Telegram Bot 等）
hermes gateway start    # 启动网关

8.2 支持的平台

平台	特色功能
Telegram	语音消息转文字、跨平台连续对话
Discord	服务器管理、频道消息处理
Slack	工作空间集成
WhatsApp	随时随地对话
Signal	端到端加密
Email	邮件收发

8.3 实际使用场景

场景 1：你在地铁上
  → 打开 Telegram，发语音："帮我看看服务器 CPU 使用率"
  → Hermes 在云端 VPS 上执行，把结果发回 Telegram

场景 2：你在开会
  → Discord 上同事问了个技术问题
  → @Hermes Bot，它直接回答

场景 3：你下班了
  → Hermes 按计划执行定时任务
  → 有问题自动给你发 Slack 通知

九、MCP 集成：无限扩展

9.1 什么是 MCP？

MCP（Model Context Protocol）是一个让 AI Agent 连接外部工具和服务的标准协议。

你可以理解为：

MCP 就像是给 AI 装了一个"万能插头"，什么工具都能接。

9.2 怎么用？

hermes tools    # 在工具配置中添加 MCP 服务器

比如你可以连接：

🖥️ computer-use-linux — 控制 Linux 桌面
🌐 浏览器自动化
🗄️ 数据库操作
📁 文件系统
……

十、安全机制：别担心，它很安全

10.1 命令审批

不是所有命令都能直接执行。Hermes 有命令审批机制：

Hermes 要执行：rm -rf /tmp/old-builds
            ↓
        在审批名单里？── 是 ──→ 直接执行
            │
            否
            ↓
        弹出确认："Hermes 想执行 rm -rf /tmp/old-builds，允许吗？"
            ↓
        你确认后才执行

10.2 其他安全特性

特性	说明
DM 配对	只有你指定的用户才能和 Bot 对话
容器隔离	在 Docker 容器中执行，不影响宿主机
密钥安全	API Key 独立存储，不混在对话中

十一、架构与项目结构

对于想深入了解或参与贡献的开发者，这里简单介绍 Hermes 的架构：

11.1 Agent Loop（核心循环）

用户输入
   │
   ▼
┌─────────────────────────┐
│   1. 理解意图            │
│   2. 检查技能库          │
│   3. 选择工具/技能       │
│   4. 执行操作            │
│   5. 观察结果            │
│   6. 判断是否完成         │
│      ├── 完成 → 返回结果  │
│      └── 未完成 → 回到 3  │
│   7. 评估是否值得记住     │
│      ├── 是 → 存入记忆    │
│      └── 否 → 继续        │
│   8. 评估是否值得提取技能  │
│      ├── 是 → 创建技能    │
│      └── 否 → 继续        │
└─────────────────────────┘

11.2 参与贡献

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
./setup-hermes.sh     # 自动安装所有依赖
./hermes              # 启动开发版本

十二、从 OpenClaw 迁移

如果你之前用的是 OpenClaw（OpenHands 的一个分支），Hermes 提供了一键迁移：

hermes claw migrate              # 交互式迁移
hermes claw migrate --dry-run    # 先预览，看看会迁移什么
hermes claw migrate --overwrite  # 覆盖已有冲突

会自动导入：

✅ 人格文件（SOUL.md）
✅ 记忆（MEMORY.md、USER.md）
✅ 技能
✅ 命令白名单
✅ 消息平台配置
✅ API 密钥
✅ TTS 资源

十三、Hermes Agent vs 其他 Agent 框架对比

对比维度	Hermes Agent	AutoGPT	CrewAI	LangChain Agent
自我学习	✅ 自动创建和改进技能	❌	❌	❌
用户建模	✅ Honcho 系统建立用户画像	❌	❌	❌
跨会话记忆	✅ FTS5 搜索 + LLM 摘要	有限	❌	需自己实现
消息平台	✅ Telegram/Discord/Slack/WhatsApp/Signal	❌	❌	❌
定时任务	✅ 内置 cron	❌	❌	❌
子代理并行	✅ 内置	❌	✅	需自己实现
模型绑定	❌ 支持 200+ 模型	OpenAI	任意	任意
安装难度	⭐ 一行命令	⭐⭐⭐	⭐⭐	⭐⭐⭐
运行成本	$5 VPS 即可	需要 OpenAI	取决于模型	取决于模型
开源协议	MIT	MIT	MIT	MIT

十四、实战：用 Hermes Agent 做几件酷事

14.1 场景一：自动日报

你："每天早上9点，总结我的 GitHub 活动和服务器状态，发到 Telegram"

Hermes：
  1. 创建 cron 任务
  2. 每天早上 9 点：
     - 查 GitHub API 获取昨日 commit/PR
     - SSH 到服务器获取 CPU/内存/磁盘数据
     - 生成漂亮的结构化报告
     - 推送到你的 Telegram

14.2 场景二：代码审查助手

你在 Discord 频道发：
  "@hermes 帮我 review 一下 PR #42"

Hermes：
  1. 调用 GitHub API 获取 PR diff
  2. 分析代码质量、安全风险、性能问题
  3. 在 Discord 频道回复审查意见

14.3 场景三：学习新技能

第一次：
  你："帮我用 Docker 部署一个 PostgreSQL 主从集群"
  Hermes：→ 查资料 → 写配置 → 测试 → 成功
          → 自动创建 skill: "deploy-postgres-cluster"

第二次：
  你："帮我部署 PG 集群"
  Hermes：→ 直接调用技能 → 3秒搞定 ✅

十五、常见问题 FAQ

Q1：Hermes Agent 免费吗？

✅ 完全开源免费（MIT 协议）。但你需要为使用的 LLM 模型付费（也可以用免费模型）。

Q2：我需要 GPU 吗？

❌ 不需要。Hermes 本身不跑模型，它调用外部 LLM API。只需要一台能上网的机器就行。

Q3：支持中文吗？

✅ 支持。取决于你选择的 LLM 模型是否支持中文（比如 GLM、Kimi 等国产模型原生支持）。

Q4：数据安全吗？

🔒 所有数据存在你自己的机器上（~/.hermes/ 目录）。不会上传到任何第三方服务器。

Q5：可以在手机上用吗？

✅ 可以。通过 Telegram/Discord/WhatsApp 在手机上和 Hermes 对话。也可以在 Android Termux 上直接安装。

Q6：和 ChatGPT 有什么区别？

ChatGPT 是"聊天工具"，Hermes 是"AI 员工"。ChatGPT 聊完就忘，Hermes 会记住你、学会技能、自动执行定时任务、还能并行处理多个任务。

Q7：怎么更新？

hermes update       # 一键更新到最新版
hermes doctor       # 诊断问题

十六、总结

Hermes Agent 是目前最接近"真正 AI 助手"概念的开源项目：

优势	说明
🧠 会学习	自动从经验中提取技能，越用越聪明
💾 有记忆	跨会话记住你的偏好和上下文
📱 随处可用	终端、Telegram、Discord、Slack……全平台覆盖
🔧 能干活	40+ 工具，定时任务，并行子代理
💰 成本低	$5 VPS 即可运行，支持 200+ 模型
🔓 完全开源	MIT 协议，代码完全透明

GitHub 地址：https://github.com/NousResearch/hermes-agent

官方文档：https://hermes-agent.nousresearch.com/docs/

Discord 社区：https://discord.gg/NousResearch

如果这篇文章对你有帮助，请点赞 + 收藏 + 关注三连！🙏
有任何问题欢迎在评论区留言，我会一一回复。

祝你早日拥有自己的 AI 员工！🤖

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

谷歌屏幕共享功能别浪费：我把它改成了视频会议，结果人多就炸了

本文分享了将闲置的浏览器推流代码改造为视频会议功能的实践过程。作者最初采用WebRTC P2P Mesh架构，发现其在小规模会议（4人以内）具有零服务器成本、低延迟等优势，但随着人数增加会面临带宽和计算资源瓶颈（6人时上传带宽达10Mbps，10人时需解码10路视频）。通过对比Mesh与SFU架构的差异，作者最终保留Mesh模式但限制最大人数（6人），并为更大规模会议推荐SFU方案。文章揭示了技术

openEuler 社区

仿B站直播功能技术选型：为什么必须用SRS而不是WebRTC P2P？

本文分析了直播平台技术选型的关键问题，指出WebRTC P2P架构不适合大规模直播场景的原因。通过对比P2P和服务端转发两种架构的带宽消耗差异，说明P2P模式在观众数量增加时会导致主播端带宽不足。文章揭示了B站、抖音等平台采用RTMP推流+SRS服务器转发+FLV/HLS拉流的经典架构的原因，并指出WebRTC仅适用于连麦等特定场景。最后给出了务实的技术选型建议：RTMP推流+SRS转发+FLV拉

openEuler 社区

ouc操作系统期末速通知识点整理

openEuler 社区

所有评论(0)

查看更多评论

行走的陀螺仪

@weixin_45284808

已为社区贡献2条内容

Hermes Agent 深度指南：一个会“自我进化“的 AI Agent，通俗易懂全解析

行走的陀螺仪

Hermes Agent 深度指南：一个会"自我进化"的 AI Agent，通俗易懂全解析

一、Hermes Agent 是什么？一句话说清楚

二、为什么说它是"自我进化"的 Agent？

2.1 五大"自我进化"能力详解

三、核心特性一览

3.1 真正的终端界面

3.2 随处部署，不限平台

3.3 定时任务

3.4 子代理 & 并行任务

3.5 灵活的模型支持

四、安装教程（手把手教你）

4.1 Linux / macOS / WSL2（推荐）

4.2 Windows 原生（PowerShell，早期 Beta）

4.3 Android / Termux

4.4 Docker 部署

五、快速上手（5 分钟从安装到对话）

5.1 基础设置

5.2 开始对话

5.3 常用命令速查

六、技能系统：Hermes 的"肌肉记忆"

6.1 什么是"技能"？

6.2 技能的生命周期

6.3 技能市场（Skills Hub）

七、记忆系统：Hermes 的"大脑"

7.1 持久记忆

7.2 用户画像（Honcho）

7.3 会话搜索

八、消息网关：让 AI 活在你的聊天软件里

8.1 什么是消息网关？

8.2 支持的平台

8.3 实际使用场景

九、MCP 集成：无限扩展

9.1 什么是 MCP？

9.2 怎么用？

十、安全机制：别担心，它很安全

10.1 命令审批

10.2 其他安全特性

十一、架构与项目结构

11.1 Agent Loop（核心循环）

11.2 参与贡献

十二、从 OpenClaw 迁移

十三、Hermes Agent vs 其他 Agent 框架对比

十四、实战：用 Hermes Agent 做几件酷事

14.1 场景一：自动日报

14.2 场景二：代码审查助手

14.3 场景三：学习新技能

十五、常见问题 FAQ

Q1：Hermes Agent 免费吗？

Q2：我需要 GPU 吗？

Q3：支持中文吗？

Q4：数据安全吗？

Q5：可以在手机上用吗？

Q6：和 ChatGPT 有什么区别？

Q7：怎么更新？

十六、总结

所有评论(0)

温馨提示：您尚未绑定手机号

行走的陀螺仪