Hermes Agent 深度指南:一个会"自我进化"的 AI Agent,通俗易懂全解析

写在前面:如果你觉得现在的 AI 助手"只会聊天、不会干活",或者"每次对话都要从头教它",那 Hermes Agent 绝对值得你了解。它不仅能调用工具、执行任务,还能记住你、积累经验、自我改进——是目前唯一内置"学习闭环"的 AI Agent。本文用最通俗的语言,带你从零搞懂它。


一、Hermes Agent 是什么?一句话说清楚

Hermes Agent 是由 Nous Research 开源的 AI 智能体(Agent),用一句话概括:

它是一个"越用越聪明"的 AI 助手——会自动从经验中学习技能、改进技能、记住你的习惯,还能在 Telegram/Discord/Slack 等平台上随时为你服务。

你可以把它想象成一个有记忆的、能自我成长的 AI 员工

  • 🧠 有记忆:它记得你是谁、你上次让它做了什么
  • 📚 会学习:完成复杂任务后,自动总结成"技能",下次直接复用
  • 🔧 能干活:40+ 内置工具,能操作文件、搜索网页、执行代码、管理服务器……
  • 📱 随处可用:终端、Telegram、Discord、Slack、WhatsApp、Signal 都能用
  • 💰 成本低:支持 200+ 种模型,可以在 $5 的 VPS 上运行,空闲时几乎不花钱

二、为什么说它是"自我进化"的 Agent?

市面上大部分 AI Agent 的工作流程是:

用户提问 → LLM 思考 → 调用工具 → 返回结果 → 结束(啥也没记住)

Hermes Agent 不一样,它有一个闭环学习系统

用户提问 → LLM 思考 → 调用工具 → 返回结果
                                    ↓
                        经验够丰富吗?── 是 ──→ 自动创建"技能"
                                    ↓
                        下次遇到类似任务 → 直接用技能(更快更准)
                                    ↓
                        技能使用中 → 发现可以改进?→ 自动优化技能
                                    ↓
                        定期"自省" → 把重要信息存入持久记忆
                                    ↓
                        跨会话搜索 → 能找到你几周前的对话上下文
                                    ↓
                        用户建模 → 越来越了解你的偏好和习惯

2.1 五大"自我进化"能力详解

能力 通俗解释 举个例子
技能自动创建 完成复杂任务后,自动把步骤总结成可复用的"技能" 你让它部署一个网站,它做完后自动生成一个"deploy-website"技能
技能自我改进 技能在使用过程中会被自动优化 "deploy-website"技能用了三次后,它自己发现可以加个缓存步骤
定期自省 Agent 会主动提醒自己把重要信息存下来 它会自动把"这个用户喜欢用pnpm而不是npm"记下来
跨会话搜索 能搜索过去的对话记录,用 LLM 总结上下文 你问"上次那个React项目的部署命令是啥",它能找到两周前的对话
用户建模 通过 Honcho 系统建立你的偏好画像 它逐渐知道你是个前端开发者、偏好 TypeScript、习惯用 VS Code

三、核心特性一览

Hermes Agent 不是普通的聊天机器人,它有这些硬核能力:

3.1 真正的终端界面

不是简单的命令行一问一答,而是一个全功能 TUI(终端用户界面)

  • ✅ 多行编辑
  • ✅ 斜杠命令自动补全
  • ✅ 对话历史浏览
  • ✅ 中断并重定向(干到一半可以改需求)
  • ✅ 工具输出实时流式显示

3.2 随处部署,不限平台

Hermes 的设计理念是:AI 不应该绑在你的电脑上

                    ┌─── Telegram ────┐
                    │                  │
用户 ──── 任意设备 ───┼─── Discord ─────┼────► Hermes Agent ──── 后端服务
                    │                  │         (云端/本地)
                    ├─── Slack ────────┤
                    │                  │
                    ├─── WhatsApp ─────┤
                    │                  │
                    ├─── Signal ───────┤
                    │                  │
                    └─── CLI 终端 ─────┘

你可以在 Telegram 上发语音消息,它会自动转文字并执行。在地铁上用手机让 AI 帮你处理服务器问题,完全没问题。

3.3 定时任务

内置 cron 调度器,可以用自然语言设置定时任务:

# 在对话中直接说:
"每天早上9点给我发一份服务器状态报告"
"每周五下午5点备份数据库"
"每天凌晨2点检查网站是否正常"

它会自动创建 cron 任务,结果推送到你指定的平台(Telegram/Discord/邮箱等)。

3.4 子代理 & 并行任务

可以派生子代理,让多个任务并行执行:

你:"帮我同时做三件事:
     1. 搜索最新的 React 19 变化
     2. 检查服务器的磁盘空间
     3. 写一个 Python 脚本处理 CSV"

Hermes:├── 子代理 A:搜索 React 19 变更
        ├── 子代理 B:SSH 到服务器检查磁盘
        └── 子代理 C:编写 Python 脚本
                    ↓
        全部完成后,汇总结果给你

3.5 灵活的模型支持

不绑定任何一家模型供应商,想用哪个用哪个:

供应商 说明
Nous Portal Nous Research 自家平台
OpenRouter 200+ 种模型可选
NovitaAI AI 原生云平台
NVIDIA NIM Nemotron 等模型
小米 MiMo 小米 AI 平台
z.ai/GLM 智谱 AI
Kimi/Moonshot 月之暗面
MiniMax MiniMax
Hugging Face 开源模型
OpenAI GPT 系列
自定义端点 你的私有模型

切换模型只需一行命令:

hermes model    # 交互式选择模型

四、安装教程(手把手教你)

4.1 Linux / macOS / WSL2(推荐)

一行命令搞定:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装完成后:

source ~/.bashrc    # 刷新环境变量(zsh 用户用 source ~/.zshrc)
hermes              # 启动!

4.2 Windows 原生(PowerShell,早期 Beta)

iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)

⚠️ Windows 原生支持还在早期测试阶段。如果遇到问题,推荐用 WSL2 方式安装(即用 Linux 那行命令)。

安装器会自动处理:Python 3.11、Node.js、ripgrep、ffmpeg,以及一个便携版 Git Bash(约 45MB,不需要管理员权限,不影响系统 Git)。

4.3 Android / Termux

参考官方文档中的 Termux 指南

4.4 Docker 部署

Hermes 支持七种终端后端:

后端 适用场景
Local 本地开发
Docker 容器化部署
SSH 远程服务器
Singularity HPC 集群
Modal Serverless(按需计费)
Daytona Serverless 开发环境
Vercel Sandbox 边缘计算

💡 省钱技巧:用 Modal 或 Daytona 的 serverless 模式,空闲时几乎不花钱,有请求时自动唤醒。


五、快速上手(5 分钟从安装到对话)

5.1 基础设置

hermes setup        # 运行完整设置向导(配置模型、工具等)
hermes model        # 选择 LLM 提供商和模型
hermes tools        # 配置启用的工具
hermes config set   # 设置单个配置项

5.2 开始对话

hermes              # 启动交互式终端

进入后你会看到一个漂亮的 TUI 界面,直接打字就能聊天。

5.3 常用命令速查

命令 作用 通俗理解
/new/reset 开始新对话 “把之前的上下文清空,重新开始”
/model 切换模型 “换个大脑”
/personality 设置人格 “让 AI 扮演某个角色”
/retry 重试上一轮 “刚才的回答不满意,再来一次”
/undo 撤销上一轮 “假装上一轮没发生”
/compress 压缩上下文 “总结一下之前的对话,省点 token”
/skills 浏览技能 “看看我学会了哪些技能”
/stop 中断当前任务 “停下!我有新想法”
/usage 查看 token 用量 “看看花了多少钱”

六、技能系统:Hermes 的"肌肉记忆"

这是 Hermes Agent 最与众不同的特性,值得单独用一章讲。

6.1 什么是"技能"?

技能(Skill)就是 Agent 从经验中自动提取的可复用操作流程

打个比方:

你第一次让 AI “部署一个 Node.js 应用到服务器”,它可能需要 10 步才能完成。
做完后,它会自动创建一个 deploy-nodejs 技能。
下次你说"部署 Node.js",它直接调用技能,3 步搞定。

6.2 技能的生命周期

初次使用 ──→ 任务完成 ──→ 经验足够?
                            │
                是 ◄─────────┘
                │
                ▼
        自动创建技能文件
        (保存到 ~/.hermes/skills/)
                │
                ▼
        下次遇到类似任务
                │
                ▼
        直接调用技能(省去思考时间)
                │
                ▼
        使用过程中发现改进点?
                │
                是
                ▼
        自动优化技能内容

6.3 技能市场(Skills Hub)

Hermes 还有一个开放的技能市场agentskills.io

  • 🔍 搜索别人分享的技能
  • 📦 一键安装社区技能
  • 🎁 分享你自己创建的技能
  • 📋 兼容 agentskills.io 开放标准

七、记忆系统:Hermes 的"大脑"

7.1 持久记忆

Hermes 的记忆不是"聊完就忘",而是跨会话持久化的:

今天你告诉它:"我喜欢用 TypeScript"
     ↓
明天你开新对话,它已经知道了
     ↓
一周后你让它写代码,它默认就用 TypeScript

7.2 用户画像(Honcho)

Hermes 使用 Honcho 系统进行用户建模

第 1 次对话:"我是做前端的"
  → 记录:用户职业 = 前端开发

第 5 次对话:"帮我用 React 写个组件"
  → 强化:前端 + React

第 20 次对话:"这个组件用 Tailwind 好看"
  → 补充:偏好 Tailwind CSS

结果:它已经完全了解你的技术栈和偏好了

7.3 会话搜索

使用 FTS5(全文搜索引擎)+ LLM 摘要:

你:"两周前我让你分析的那个 Python 性能问题,结论是什么?"

Hermes:→ 搜索历史会话
        → 找到相关对话
        → LLM 总结上下文
        → "你当时那个 Flask 接口慢的原因是数据库查询没加索引……"

八、消息网关:让 AI 活在你的聊天软件里

8.1 什么是消息网关?

消息网关(Messaging Gateway)让 Hermes 连接到你的聊天平台:

hermes gateway setup    # 配置网关(绑定 Telegram Bot 等)
hermes gateway start    # 启动网关

8.2 支持的平台

平台 特色功能
Telegram 语音消息转文字、跨平台连续对话
Discord 服务器管理、频道消息处理
Slack 工作空间集成
WhatsApp 随时随地对话
Signal 端到端加密
Email 邮件收发

8.3 实际使用场景

场景 1:你在地铁上
  → 打开 Telegram,发语音:"帮我看看服务器 CPU 使用率"
  → Hermes 在云端 VPS 上执行,把结果发回 Telegram

场景 2:你在开会
  → Discord 上同事问了个技术问题
  → @Hermes Bot,它直接回答

场景 3:你下班了
  → Hermes 按计划执行定时任务
  → 有问题自动给你发 Slack 通知

九、MCP 集成:无限扩展

9.1 什么是 MCP?

MCP(Model Context Protocol)是一个让 AI Agent 连接外部工具和服务的标准协议。

你可以理解为:

MCP 就像是给 AI 装了一个"万能插头",什么工具都能接。

9.2 怎么用?

hermes tools    # 在工具配置中添加 MCP 服务器

比如你可以连接:

  • 🖥️ computer-use-linux — 控制 Linux 桌面
  • 🌐 浏览器自动化
  • 🗄️ 数据库操作
  • 📁 文件系统
  • ……

十、安全机制:别担心,它很安全

10.1 命令审批

不是所有命令都能直接执行。Hermes 有命令审批机制

Hermes 要执行:rm -rf /tmp/old-builds
            ↓
        在审批名单里?── 是 ──→ 直接执行
            │
            否
            ↓
        弹出确认:"Hermes 想执行 rm -rf /tmp/old-builds,允许吗?"
            ↓
        你确认后才执行

10.2 其他安全特性

特性 说明
DM 配对 只有你指定的用户才能和 Bot 对话
容器隔离 在 Docker 容器中执行,不影响宿主机
密钥安全 API Key 独立存储,不混在对话中

十一、架构与项目结构

对于想深入了解或参与贡献的开发者,这里简单介绍 Hermes 的架构:

11.1 Agent Loop(核心循环)

用户输入
   │
   ▼
┌─────────────────────────┐
│   1. 理解意图            │
│   2. 检查技能库          │
│   3. 选择工具/技能       │
│   4. 执行操作            │
│   5. 观察结果            │
│   6. 判断是否完成         │
│      ├── 完成 → 返回结果  │
│      └── 未完成 → 回到 3  │
│   7. 评估是否值得记住     │
│      ├── 是 → 存入记忆    │
│      └── 否 → 继续        │
│   8. 评估是否值得提取技能  │
│      ├── 是 → 创建技能    │
│      └── 否 → 继续        │
└─────────────────────────┘

11.2 参与贡献

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
./setup-hermes.sh     # 自动安装所有依赖
./hermes              # 启动开发版本

十二、从 OpenClaw 迁移

如果你之前用的是 OpenClaw(OpenHands 的一个分支),Hermes 提供了一键迁移:

hermes claw migrate              # 交互式迁移
hermes claw migrate --dry-run    # 先预览,看看会迁移什么
hermes claw migrate --overwrite  # 覆盖已有冲突

会自动导入:

  • ✅ 人格文件(SOUL.md)
  • ✅ 记忆(MEMORY.md、USER.md)
  • ✅ 技能
  • ✅ 命令白名单
  • ✅ 消息平台配置
  • ✅ API 密钥
  • ✅ TTS 资源

十三、Hermes Agent vs 其他 Agent 框架对比

对比维度 Hermes Agent AutoGPT CrewAI LangChain Agent
自我学习 ✅ 自动创建和改进技能
用户建模 ✅ Honcho 系统建立用户画像
跨会话记忆 ✅ FTS5 搜索 + LLM 摘要 有限 需自己实现
消息平台 ✅ Telegram/Discord/Slack/WhatsApp/Signal
定时任务 ✅ 内置 cron
子代理并行 ✅ 内置 需自己实现
模型绑定 ❌ 支持 200+ 模型 OpenAI 任意 任意
安装难度 ⭐ 一行命令 ⭐⭐⭐ ⭐⭐ ⭐⭐⭐
运行成本 $5 VPS 即可 需要 OpenAI 取决于模型 取决于模型
开源协议 MIT MIT MIT MIT

十四、实战:用 Hermes Agent 做几件酷事

14.1 场景一:自动日报

你:"每天早上9点,总结我的 GitHub 活动和服务器状态,发到 Telegram"

Hermes:
  1. 创建 cron 任务
  2. 每天早上 9 点:
     - 查 GitHub API 获取昨日 commit/PR
     - SSH 到服务器获取 CPU/内存/磁盘数据
     - 生成漂亮的结构化报告
     - 推送到你的 Telegram

14.2 场景二:代码审查助手

你在 Discord 频道发:
  "@hermes 帮我 review 一下 PR #42"

Hermes:
  1. 调用 GitHub API 获取 PR diff
  2. 分析代码质量、安全风险、性能问题
  3. 在 Discord 频道回复审查意见

14.3 场景三:学习新技能

第一次:
  你:"帮我用 Docker 部署一个 PostgreSQL 主从集群"
  Hermes:→ 查资料 → 写配置 → 测试 → 成功
          → 自动创建 skill: "deploy-postgres-cluster"

第二次:
  你:"帮我部署 PG 集群"
  Hermes:→ 直接调用技能 → 3秒搞定 ✅

十五、常见问题 FAQ

Q1:Hermes Agent 免费吗?

完全开源免费(MIT 协议)。但你需要为使用的 LLM 模型付费(也可以用免费模型)。

Q2:我需要 GPU 吗?

不需要。Hermes 本身不跑模型,它调用外部 LLM API。只需要一台能上网的机器就行。

Q3:支持中文吗?

✅ 支持。取决于你选择的 LLM 模型是否支持中文(比如 GLM、Kimi 等国产模型原生支持)。

Q4:数据安全吗?

🔒 所有数据存在你自己的机器上(~/.hermes/ 目录)。不会上传到任何第三方服务器。

Q5:可以在手机上用吗?

✅ 可以。通过 Telegram/Discord/WhatsApp 在手机上和 Hermes 对话。也可以在 Android Termux 上直接安装。

Q6:和 ChatGPT 有什么区别?

ChatGPT 是"聊天工具",Hermes 是"AI 员工"。ChatGPT 聊完就忘,Hermes 会记住你、学会技能、自动执行定时任务、还能并行处理多个任务。

Q7:怎么更新?

hermes update       # 一键更新到最新版
hermes doctor       # 诊断问题

十六、总结

Hermes Agent 是目前最接近"真正 AI 助手"概念的开源项目:

优势 说明
🧠 会学习 自动从经验中提取技能,越用越聪明
💾 有记忆 跨会话记住你的偏好和上下文
📱 随处可用 终端、Telegram、Discord、Slack……全平台覆盖
🔧 能干活 40+ 工具,定时任务,并行子代理
💰 成本低 $5 VPS 即可运行,支持 200+ 模型
🔓 完全开源 MIT 协议,代码完全透明

GitHub 地址https://github.com/NousResearch/hermes-agent

官方文档https://hermes-agent.nousresearch.com/docs/

Discord 社区https://discord.gg/NousResearch


如果这篇文章对你有帮助,请点赞 + 收藏 + 关注三连!🙏
有任何问题欢迎在评论区留言,我会一一回复。

祝你早日拥有自己的 AI 员工!🤖

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐