Hermes Agent 深度指南:一个会“自我进化“的 AI Agent,通俗易懂全解析
技能(Skill)就是 Agent 从经验中自动提取的可复用操作流程。打个比方:你第一次让 AI “部署一个 Node.js 应用到服务器”,它可能需要 10 步才能完成。做完后,它会自动创建一个技能。下次你说"部署 Node.js",它直接调用技能,3 步搞定。hermes gateway setup # 配置网关(绑定 Telegram Bot 等) hermes gateway start
Hermes Agent 深度指南:一个会"自我进化"的 AI Agent,通俗易懂全解析
写在前面:如果你觉得现在的 AI 助手"只会聊天、不会干活",或者"每次对话都要从头教它",那 Hermes Agent 绝对值得你了解。它不仅能调用工具、执行任务,还能记住你、积累经验、自我改进——是目前唯一内置"学习闭环"的 AI Agent。本文用最通俗的语言,带你从零搞懂它。
一、Hermes Agent 是什么?一句话说清楚
Hermes Agent 是由 Nous Research 开源的 AI 智能体(Agent),用一句话概括:
它是一个"越用越聪明"的 AI 助手——会自动从经验中学习技能、改进技能、记住你的习惯,还能在 Telegram/Discord/Slack 等平台上随时为你服务。
你可以把它想象成一个有记忆的、能自我成长的 AI 员工:
- 🧠 有记忆:它记得你是谁、你上次让它做了什么
- 📚 会学习:完成复杂任务后,自动总结成"技能",下次直接复用
- 🔧 能干活:40+ 内置工具,能操作文件、搜索网页、执行代码、管理服务器……
- 📱 随处可用:终端、Telegram、Discord、Slack、WhatsApp、Signal 都能用
- 💰 成本低:支持 200+ 种模型,可以在 $5 的 VPS 上运行,空闲时几乎不花钱
二、为什么说它是"自我进化"的 Agent?
市面上大部分 AI Agent 的工作流程是:
用户提问 → LLM 思考 → 调用工具 → 返回结果 → 结束(啥也没记住)
Hermes Agent 不一样,它有一个闭环学习系统:
用户提问 → LLM 思考 → 调用工具 → 返回结果
↓
经验够丰富吗?── 是 ──→ 自动创建"技能"
↓
下次遇到类似任务 → 直接用技能(更快更准)
↓
技能使用中 → 发现可以改进?→ 自动优化技能
↓
定期"自省" → 把重要信息存入持久记忆
↓
跨会话搜索 → 能找到你几周前的对话上下文
↓
用户建模 → 越来越了解你的偏好和习惯
2.1 五大"自我进化"能力详解
| 能力 | 通俗解释 | 举个例子 |
|---|---|---|
| 技能自动创建 | 完成复杂任务后,自动把步骤总结成可复用的"技能" | 你让它部署一个网站,它做完后自动生成一个"deploy-website"技能 |
| 技能自我改进 | 技能在使用过程中会被自动优化 | "deploy-website"技能用了三次后,它自己发现可以加个缓存步骤 |
| 定期自省 | Agent 会主动提醒自己把重要信息存下来 | 它会自动把"这个用户喜欢用pnpm而不是npm"记下来 |
| 跨会话搜索 | 能搜索过去的对话记录,用 LLM 总结上下文 | 你问"上次那个React项目的部署命令是啥",它能找到两周前的对话 |
| 用户建模 | 通过 Honcho 系统建立你的偏好画像 | 它逐渐知道你是个前端开发者、偏好 TypeScript、习惯用 VS Code |
三、核心特性一览
Hermes Agent 不是普通的聊天机器人,它有这些硬核能力:
3.1 真正的终端界面
不是简单的命令行一问一答,而是一个全功能 TUI(终端用户界面):
- ✅ 多行编辑
- ✅ 斜杠命令自动补全
- ✅ 对话历史浏览
- ✅ 中断并重定向(干到一半可以改需求)
- ✅ 工具输出实时流式显示
3.2 随处部署,不限平台
Hermes 的设计理念是:AI 不应该绑在你的电脑上。
┌─── Telegram ────┐
│ │
用户 ──── 任意设备 ───┼─── Discord ─────┼────► Hermes Agent ──── 后端服务
│ │ (云端/本地)
├─── Slack ────────┤
│ │
├─── WhatsApp ─────┤
│ │
├─── Signal ───────┤
│ │
└─── CLI 终端 ─────┘
你可以在 Telegram 上发语音消息,它会自动转文字并执行。在地铁上用手机让 AI 帮你处理服务器问题,完全没问题。
3.3 定时任务
内置 cron 调度器,可以用自然语言设置定时任务:
# 在对话中直接说:
"每天早上9点给我发一份服务器状态报告"
"每周五下午5点备份数据库"
"每天凌晨2点检查网站是否正常"
它会自动创建 cron 任务,结果推送到你指定的平台(Telegram/Discord/邮箱等)。
3.4 子代理 & 并行任务
可以派生子代理,让多个任务并行执行:
你:"帮我同时做三件事:
1. 搜索最新的 React 19 变化
2. 检查服务器的磁盘空间
3. 写一个 Python 脚本处理 CSV"
Hermes:├── 子代理 A:搜索 React 19 变更
├── 子代理 B:SSH 到服务器检查磁盘
└── 子代理 C:编写 Python 脚本
↓
全部完成后,汇总结果给你
3.5 灵活的模型支持
不绑定任何一家模型供应商,想用哪个用哪个:
| 供应商 | 说明 |
|---|---|
| Nous Portal | Nous Research 自家平台 |
| OpenRouter | 200+ 种模型可选 |
| NovitaAI | AI 原生云平台 |
| NVIDIA NIM | Nemotron 等模型 |
| 小米 MiMo | 小米 AI 平台 |
| z.ai/GLM | 智谱 AI |
| Kimi/Moonshot | 月之暗面 |
| MiniMax | MiniMax |
| Hugging Face | 开源模型 |
| OpenAI | GPT 系列 |
| 自定义端点 | 你的私有模型 |
切换模型只需一行命令:
hermes model # 交互式选择模型
四、安装教程(手把手教你)
4.1 Linux / macOS / WSL2(推荐)
一行命令搞定:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装完成后:
source ~/.bashrc # 刷新环境变量(zsh 用户用 source ~/.zshrc)
hermes # 启动!
4.2 Windows 原生(PowerShell,早期 Beta)
iex (irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1)
⚠️ Windows 原生支持还在早期测试阶段。如果遇到问题,推荐用 WSL2 方式安装(即用 Linux 那行命令)。
安装器会自动处理:Python 3.11、Node.js、ripgrep、ffmpeg,以及一个便携版 Git Bash(约 45MB,不需要管理员权限,不影响系统 Git)。
4.3 Android / Termux
参考官方文档中的 Termux 指南。
4.4 Docker 部署
Hermes 支持七种终端后端:
| 后端 | 适用场景 |
|---|---|
| Local | 本地开发 |
| Docker | 容器化部署 |
| SSH | 远程服务器 |
| Singularity | HPC 集群 |
| Modal | Serverless(按需计费) |
| Daytona | Serverless 开发环境 |
| Vercel Sandbox | 边缘计算 |
💡 省钱技巧:用 Modal 或 Daytona 的 serverless 模式,空闲时几乎不花钱,有请求时自动唤醒。
五、快速上手(5 分钟从安装到对话)
5.1 基础设置
hermes setup # 运行完整设置向导(配置模型、工具等)
hermes model # 选择 LLM 提供商和模型
hermes tools # 配置启用的工具
hermes config set # 设置单个配置项
5.2 开始对话
hermes # 启动交互式终端
进入后你会看到一个漂亮的 TUI 界面,直接打字就能聊天。
5.3 常用命令速查
| 命令 | 作用 | 通俗理解 |
|---|---|---|
/new 或 /reset |
开始新对话 | “把之前的上下文清空,重新开始” |
/model |
切换模型 | “换个大脑” |
/personality |
设置人格 | “让 AI 扮演某个角色” |
/retry |
重试上一轮 | “刚才的回答不满意,再来一次” |
/undo |
撤销上一轮 | “假装上一轮没发生” |
/compress |
压缩上下文 | “总结一下之前的对话,省点 token” |
/skills |
浏览技能 | “看看我学会了哪些技能” |
/stop |
中断当前任务 | “停下!我有新想法” |
/usage |
查看 token 用量 | “看看花了多少钱” |
六、技能系统:Hermes 的"肌肉记忆"
这是 Hermes Agent 最与众不同的特性,值得单独用一章讲。
6.1 什么是"技能"?
技能(Skill)就是 Agent 从经验中自动提取的可复用操作流程。
打个比方:
你第一次让 AI “部署一个 Node.js 应用到服务器”,它可能需要 10 步才能完成。
做完后,它会自动创建一个deploy-nodejs技能。
下次你说"部署 Node.js",它直接调用技能,3 步搞定。
6.2 技能的生命周期
初次使用 ──→ 任务完成 ──→ 经验足够?
│
是 ◄─────────┘
│
▼
自动创建技能文件
(保存到 ~/.hermes/skills/)
│
▼
下次遇到类似任务
│
▼
直接调用技能(省去思考时间)
│
▼
使用过程中发现改进点?
│
是
▼
自动优化技能内容
6.3 技能市场(Skills Hub)
Hermes 还有一个开放的技能市场:agentskills.io
- 🔍 搜索别人分享的技能
- 📦 一键安装社区技能
- 🎁 分享你自己创建的技能
- 📋 兼容 agentskills.io 开放标准
七、记忆系统:Hermes 的"大脑"
7.1 持久记忆
Hermes 的记忆不是"聊完就忘",而是跨会话持久化的:
今天你告诉它:"我喜欢用 TypeScript"
↓
明天你开新对话,它已经知道了
↓
一周后你让它写代码,它默认就用 TypeScript
7.2 用户画像(Honcho)
Hermes 使用 Honcho 系统进行用户建模:
第 1 次对话:"我是做前端的"
→ 记录:用户职业 = 前端开发
第 5 次对话:"帮我用 React 写个组件"
→ 强化:前端 + React
第 20 次对话:"这个组件用 Tailwind 好看"
→ 补充:偏好 Tailwind CSS
结果:它已经完全了解你的技术栈和偏好了
7.3 会话搜索
使用 FTS5(全文搜索引擎)+ LLM 摘要:
你:"两周前我让你分析的那个 Python 性能问题,结论是什么?"
Hermes:→ 搜索历史会话
→ 找到相关对话
→ LLM 总结上下文
→ "你当时那个 Flask 接口慢的原因是数据库查询没加索引……"
八、消息网关:让 AI 活在你的聊天软件里
8.1 什么是消息网关?
消息网关(Messaging Gateway)让 Hermes 连接到你的聊天平台:
hermes gateway setup # 配置网关(绑定 Telegram Bot 等)
hermes gateway start # 启动网关
8.2 支持的平台
| 平台 | 特色功能 |
|---|---|
| Telegram | 语音消息转文字、跨平台连续对话 |
| Discord | 服务器管理、频道消息处理 |
| Slack | 工作空间集成 |
| 随时随地对话 | |
| Signal | 端到端加密 |
| 邮件收发 |
8.3 实际使用场景
场景 1:你在地铁上
→ 打开 Telegram,发语音:"帮我看看服务器 CPU 使用率"
→ Hermes 在云端 VPS 上执行,把结果发回 Telegram
场景 2:你在开会
→ Discord 上同事问了个技术问题
→ @Hermes Bot,它直接回答
场景 3:你下班了
→ Hermes 按计划执行定时任务
→ 有问题自动给你发 Slack 通知
九、MCP 集成:无限扩展
9.1 什么是 MCP?
MCP(Model Context Protocol)是一个让 AI Agent 连接外部工具和服务的标准协议。
你可以理解为:
MCP 就像是给 AI 装了一个"万能插头",什么工具都能接。
9.2 怎么用?
hermes tools # 在工具配置中添加 MCP 服务器
比如你可以连接:
- 🖥️ computer-use-linux — 控制 Linux 桌面
- 🌐 浏览器自动化
- 🗄️ 数据库操作
- 📁 文件系统
- ……
十、安全机制:别担心,它很安全
10.1 命令审批
不是所有命令都能直接执行。Hermes 有命令审批机制:
Hermes 要执行:rm -rf /tmp/old-builds
↓
在审批名单里?── 是 ──→ 直接执行
│
否
↓
弹出确认:"Hermes 想执行 rm -rf /tmp/old-builds,允许吗?"
↓
你确认后才执行
10.2 其他安全特性
| 特性 | 说明 |
|---|---|
| DM 配对 | 只有你指定的用户才能和 Bot 对话 |
| 容器隔离 | 在 Docker 容器中执行,不影响宿主机 |
| 密钥安全 | API Key 独立存储,不混在对话中 |
十一、架构与项目结构
对于想深入了解或参与贡献的开发者,这里简单介绍 Hermes 的架构:
11.1 Agent Loop(核心循环)
用户输入
│
▼
┌─────────────────────────┐
│ 1. 理解意图 │
│ 2. 检查技能库 │
│ 3. 选择工具/技能 │
│ 4. 执行操作 │
│ 5. 观察结果 │
│ 6. 判断是否完成 │
│ ├── 完成 → 返回结果 │
│ └── 未完成 → 回到 3 │
│ 7. 评估是否值得记住 │
│ ├── 是 → 存入记忆 │
│ └── 否 → 继续 │
│ 8. 评估是否值得提取技能 │
│ ├── 是 → 创建技能 │
│ └── 否 → 继续 │
└─────────────────────────┘
11.2 参与贡献
git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
./setup-hermes.sh # 自动安装所有依赖
./hermes # 启动开发版本
十二、从 OpenClaw 迁移
如果你之前用的是 OpenClaw(OpenHands 的一个分支),Hermes 提供了一键迁移:
hermes claw migrate # 交互式迁移
hermes claw migrate --dry-run # 先预览,看看会迁移什么
hermes claw migrate --overwrite # 覆盖已有冲突
会自动导入:
- ✅ 人格文件(SOUL.md)
- ✅ 记忆(MEMORY.md、USER.md)
- ✅ 技能
- ✅ 命令白名单
- ✅ 消息平台配置
- ✅ API 密钥
- ✅ TTS 资源
十三、Hermes Agent vs 其他 Agent 框架对比
| 对比维度 | Hermes Agent | AutoGPT | CrewAI | LangChain Agent |
|---|---|---|---|---|
| 自我学习 | ✅ 自动创建和改进技能 | ❌ | ❌ | ❌ |
| 用户建模 | ✅ Honcho 系统建立用户画像 | ❌ | ❌ | ❌ |
| 跨会话记忆 | ✅ FTS5 搜索 + LLM 摘要 | 有限 | ❌ | 需自己实现 |
| 消息平台 | ✅ Telegram/Discord/Slack/WhatsApp/Signal | ❌ | ❌ | ❌ |
| 定时任务 | ✅ 内置 cron | ❌ | ❌ | ❌ |
| 子代理并行 | ✅ 内置 | ❌ | ✅ | 需自己实现 |
| 模型绑定 | ❌ 支持 200+ 模型 | OpenAI | 任意 | 任意 |
| 安装难度 | ⭐ 一行命令 | ⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐ |
| 运行成本 | $5 VPS 即可 | 需要 OpenAI | 取决于模型 | 取决于模型 |
| 开源协议 | MIT | MIT | MIT | MIT |
十四、实战:用 Hermes Agent 做几件酷事
14.1 场景一:自动日报
你:"每天早上9点,总结我的 GitHub 活动和服务器状态,发到 Telegram"
Hermes:
1. 创建 cron 任务
2. 每天早上 9 点:
- 查 GitHub API 获取昨日 commit/PR
- SSH 到服务器获取 CPU/内存/磁盘数据
- 生成漂亮的结构化报告
- 推送到你的 Telegram
14.2 场景二:代码审查助手
你在 Discord 频道发:
"@hermes 帮我 review 一下 PR #42"
Hermes:
1. 调用 GitHub API 获取 PR diff
2. 分析代码质量、安全风险、性能问题
3. 在 Discord 频道回复审查意见
14.3 场景三:学习新技能
第一次:
你:"帮我用 Docker 部署一个 PostgreSQL 主从集群"
Hermes:→ 查资料 → 写配置 → 测试 → 成功
→ 自动创建 skill: "deploy-postgres-cluster"
第二次:
你:"帮我部署 PG 集群"
Hermes:→ 直接调用技能 → 3秒搞定 ✅
十五、常见问题 FAQ
Q1:Hermes Agent 免费吗?
✅ 完全开源免费(MIT 协议)。但你需要为使用的 LLM 模型付费(也可以用免费模型)。
Q2:我需要 GPU 吗?
❌ 不需要。Hermes 本身不跑模型,它调用外部 LLM API。只需要一台能上网的机器就行。
Q3:支持中文吗?
✅ 支持。取决于你选择的 LLM 模型是否支持中文(比如 GLM、Kimi 等国产模型原生支持)。
Q4:数据安全吗?
🔒 所有数据存在你自己的机器上(
~/.hermes/目录)。不会上传到任何第三方服务器。
Q5:可以在手机上用吗?
✅ 可以。通过 Telegram/Discord/WhatsApp 在手机上和 Hermes 对话。也可以在 Android Termux 上直接安装。
Q6:和 ChatGPT 有什么区别?
ChatGPT 是"聊天工具",Hermes 是"AI 员工"。ChatGPT 聊完就忘,Hermes 会记住你、学会技能、自动执行定时任务、还能并行处理多个任务。
Q7:怎么更新?
hermes update # 一键更新到最新版 hermes doctor # 诊断问题
十六、总结
Hermes Agent 是目前最接近"真正 AI 助手"概念的开源项目:
| 优势 | 说明 |
|---|---|
| 🧠 会学习 | 自动从经验中提取技能,越用越聪明 |
| 💾 有记忆 | 跨会话记住你的偏好和上下文 |
| 📱 随处可用 | 终端、Telegram、Discord、Slack……全平台覆盖 |
| 🔧 能干活 | 40+ 工具,定时任务,并行子代理 |
| 💰 成本低 | $5 VPS 即可运行,支持 200+ 模型 |
| 🔓 完全开源 | MIT 协议,代码完全透明 |
GitHub 地址:https://github.com/NousResearch/hermes-agent
官方文档:https://hermes-agent.nousresearch.com/docs/
Discord 社区:https://discord.gg/NousResearch
如果这篇文章对你有帮助,请点赞 + 收藏 + 关注三连!🙏
有任何问题欢迎在评论区留言,我会一一回复。祝你早日拥有自己的 AI 员工!🤖
openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构
更多推荐

所有评论(0)