Hermes Agent 官方文档解读 vs OpenClaw
重要:本篇以官方文档为核心,替代之前仅基于视频描述的版本。信息源优先级:官方文档 > 权威分析 > 视频描述。
一、产品定位
Hermes Agent 是 Nous Research(Hermes-3 / Nomos / Psyche 模型家族)开发的开源 AI Agent,MIT 协议,2026 年 2 月发布。
官网:https://hermes-agent.nousresearch.com/
GitHub:约 22,000 Stars
核心理念:
“It’s not a coding copilot tethered to an IDE or a chatbot wrapper around a single API. It’s an autonomous agent that gets more capable the longer it runs.”
与 OpenClaw 的核心定位差异:
- OpenClaw = 本地优先的 Agent 编排框架,强项在多渠道集成、团队协作、企业治理
- Hermes Agent = 自进化个人操作者,强项在长期记忆、自动化学技能、用户偏好建模
二、核心架构(官方)
代码规模
| 组件 | 文件 | 规模 |
|---|---|---|
| AIAgent(对话循环) | run_agent.py | ~9,200 行 |
| HermesCLI(交互终端) | cli.py | ~8,500 行 |
| Gateway(消息网关) | gateway/run.py | ~5,800 行 |
| 配置命令 | hermes_cli/main.py | ~4,200 行 |
| 交互式安装向导 | hermes_cli/setup.py | ~3,500 行 |
| 测试套件 | tests/ | 3,000+ 测试 |
6 种终端后端(Terminal Backends)
| 后端 | 用途 |
|---|---|
| local | 本地机器直接执行 |
| Docker | 容器化隔离执行 |
| SSH | 远程服务器 |
| Daytona | Serverless 持久化 |
| Modal | Serverless 持久化 |
| Singularity | HPC 容器 |
Serverless 特性:Daytona 和 Modal 支持休眠——环境空闲时几乎零成本。
三、记忆系统(官方详解)
两层记忆文件
| 文件 | 用途 | 容量 |
|---|---|---|
MEMORY.md |
Agent 的个人笔记:环境事实、约定、学到的教训 | 2,200 chars (~800 tokens) |
USER.md |
用户画像:偏好、沟通风格、期望 | 1,375 chars (~500 tokens) |
技能系统(Self-Improving Skills)
Skills 是按需加载的知识文档,遵循 渐进式披露(Progressive Disclosure) 模式。Agent 会在以下时机自动创建技能:
- 完成复杂任务(5+ 工具调用)后
- 遇到错误或死胡同并找到可行路径后
- 用户纠正了 Agent 的方法后
- 发现非平凡工作流时
四、MCP(Model Context Protocol)集成
支持两种 MCP 服务器
| 类型 | 配置方式 | 适用场景 |
|---|---|---|
| Stdio(本地子进程) | command + args + env |
本地安装、低延迟 |
| HTTP(远程端点) | url + headers |
托管服务、组织内部 MCP |
动态工具发现
MCP 服务器可通过 notifications/tools/list_changed 通知 Hermes 工具列表变化,Hermes 自动重新获取并更新注册表,无需手动 reload。
五、语音模式(Voice Mode)
三种语音功能
| 功能 | 平台 | 说明 |
|---|---|---|
| Interactive Voice | CLI | Ctrl+B 录音,语音打断,流式 TTS |
| Auto Voice Reply | Telegram, Discord | 文字回复同时发送语音音频 |
| Voice Channel | Discord | 加入 VC,聆听用户发言并语音回复 |
本地 STT(零 API 成本)
pip install faster-whisper # 免费,运行本地,约 150MB 模型,首次使用自动下载
六、SOUL.md 人格系统
SOUL.md vs AGENTS.md
| 用途 | SOUL.md | AGENTS.md |
|---|---|---|
| 身份/人格 | ✅ | ❌ |
| 语气/风格 | ✅ | ❌ |
| 沟通偏好 | ✅ | ❌ |
| 项目架构 | ❌ | ✅ |
| 代码约定 | ❌ | ✅ |
| 工具偏好 | ❌ | ✅ |
| 仓库特定工作流 | ❌ | ✅ |
判断标准:如果它应该跟着你到处走 → SOUL.md;如果它属于某个项目 → AGENTS.md
七、14+ 消息平台
官方支持的平台(一个 Gateway,统一体验):
CLI, Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, DingTalk, Feishu, WeCom, Home Assistant
Signal 和 Feishu 是 Hermes 独有的差异化渠道。
八、与 OpenClaw 的全面对比
功能对照表
| 功能 | Hermes Agent | OpenClaw |
|---|---|---|
| 记忆系统 | 多层(Active + Archive + Honcho),FTS5 检索,~3,300 chars 两文件 | 每 Assistant 独立隔离记忆 |
| 技能系统 | 47 工具,Agent 自动创建/改进技能 | 52+ 内置 Skills,文件 precedence |
| 自进化 | ✅ 任务完成自动写 Skill 文件 | ❌ 不会自动生成新技能 |
| 用户建模 | Honcho dialectic 用户建模 | ❌ |
| 部署后端 | 6 种(local/Docker/SSH/Daytona/Modal/Singularity) | 托管 + 云容器 |
| Serverless 休眠 | ✅ Daytona/Modal 空闲零成本 | ❌ |
| 渠道数量 | 14+(Signal + Feishu 独有) | 主流消息平台 |
| 模型支持 | 200+ via OpenRouter/Nous Portal/Ollama | BYOK:Claude/GPT/Gemini/xAI/Groq/Mistral |
| MCP 支持 | ✅ 原生 MCP,stdio + HTTP,动态发现 | ❌(非原生) |
| 语音模式 | ✅ 本地 STT(零 API 成本),流式 TTS | ❌ |
| 技能格式 | agentskills.io(开放标准) | 专有 |
| 隐私/安全 | 零遥测,容器沙箱 | Device pairing,Gateway 认证 |
| RL 训练 | ✅ Atropos RL 训练支持 | ❌ |
| 批量处理 | ✅ Batch trajectory 生成 | ❌ |
| SOUL.md | ✅ 原生人格系统 | 类似但非 Slot #1 |
互补用法(高级用户)
“Use OpenClaw as the conductor: routing tasks, handling auth, integrating with infra. Use Hermes as the lead specialist: when a task really benefits from long-term memory and learned skills, route it to Hermes via MCP or a custom tool.”
九、适用场景决策树
需要 AI Agent?
├─ 需要多角色团队隔离 + 企业治理 + 5+ 商业渠道
│ └─ → OpenClaw(Gateway 架构天生适合)
├─ 重复性服务业务(agency/咨询/SaaS ops)
│ └─ → Hermes(自动沉淀工作流为技能,越用越强)
├─ 需要 Signal 或 Feishu 渠道
│ └─ → Hermes(OpenClaw 不支持)
├─ 需要本地零成本 STT(语音交互)
│ └─ → Hermes(faster-whisper 本地运行,无需 API key)
├─ 需要 MCP 外部工具生态(GitHub/数据库/内部 API)
│ └─ → Hermes(原生 MCP 支持,动态发现)
├─ 已有成熟 OpenClaw 团队基础设施
│ └─ → OpenClaw(生态成熟,治理完善)
└─ 需要 RL 训练 / 轨迹导出 / 研究工作流
└─ → Hermes(Atropos RL + Batch Runner 内置)