Hermes Agent 官方文档解读 vs OpenClaw

重要：本篇以官方文档为核心，替代之前仅基于视频描述的版本。信息源优先级：官方文档 > 权威分析 > 视频描述。

一、产品定位

Hermes Agent 是 Nous Research（Hermes-3 / Nomos / Psyche 模型家族）开发的开源 AI Agent，MIT 协议，2026 年 2 月发布。

官网：https://hermes-agent.nousresearch.com/
GitHub：约 22,000 Stars

核心理念：

“It’s not a coding copilot tethered to an IDE or a chatbot wrapper around a single API. It’s an autonomous agent that gets more capable the longer it runs.”

与 OpenClaw 的核心定位差异：

OpenClaw = 本地优先的 Agent 编排框架，强项在多渠道集成、团队协作、企业治理
Hermes Agent = 自进化个人操作者，强项在长期记忆、自动化学技能、用户偏好建模

二、核心架构（官方）

代码规模

组件	文件	规模
AIAgent（对话循环）	run_agent.py	~9,200 行
HermesCLI（交互终端）	cli.py	~8,500 行
Gateway（消息网关）	gateway/run.py	~5,800 行
配置命令	hermes_cli/main.py	~4,200 行
交互式安装向导	hermes_cli/setup.py	~3,500 行
测试套件	tests/	3,000+ 测试

6 种终端后端（Terminal Backends）

后端	用途
local	本地机器直接执行
Docker	容器化隔离执行
SSH	远程服务器
Daytona	Serverless 持久化
Modal	Serverless 持久化
Singularity	HPC 容器

Serverless 特性：Daytona 和 Modal 支持休眠——环境空闲时几乎零成本。

三、记忆系统（官方详解）

两层记忆文件

文件	用途	容量
`MEMORY.md`	Agent 的个人笔记：环境事实、约定、学到的教训	2,200 chars (~800 tokens)
`USER.md`	用户画像：偏好、沟通风格、期望	1,375 chars (~500 tokens)

技能系统（Self-Improving Skills）

Skills 是按需加载的知识文档，遵循 渐进式披露（Progressive Disclosure） 模式。Agent 会在以下时机自动创建技能：

完成复杂任务（5+ 工具调用）后
遇到错误或死胡同并找到可行路径后
用户纠正了 Agent 的方法后
发现非平凡工作流时

四、MCP（Model Context Protocol）集成

支持两种 MCP 服务器

类型	配置方式	适用场景
Stdio（本地子进程）	`command` + `args` + `env`	本地安装、低延迟
HTTP（远程端点）	`url` + `headers`	托管服务、组织内部 MCP

动态工具发现

MCP 服务器可通过 notifications/tools/list_changed 通知 Hermes 工具列表变化，Hermes 自动重新获取并更新注册表，无需手动 reload。

五、语音模式（Voice Mode）

三种语音功能

功能	平台	说明
Interactive Voice	CLI	Ctrl+B 录音，语音打断，流式 TTS
Auto Voice Reply	Telegram, Discord	文字回复同时发送语音音频
Voice Channel	Discord	加入 VC，聆听用户发言并语音回复

本地 STT（零 API 成本）

pip install faster-whisper  # 免费，运行本地，约 150MB 模型，首次使用自动下载

六、SOUL.md 人格系统

SOUL.md vs AGENTS.md

用途	SOUL.md	AGENTS.md
身份/人格	✅	❌
语气/风格	✅	❌
沟通偏好	✅	❌
项目架构	❌	✅
代码约定	❌	✅
工具偏好	❌	✅
仓库特定工作流	❌	✅

判断标准：如果它应该跟着你到处走 → SOUL.md；如果它属于某个项目 → AGENTS.md

七、14+ 消息平台

官方支持的平台（一个 Gateway，统一体验）：

CLI, Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, DingTalk, Feishu, WeCom, Home Assistant

Signal 和 Feishu 是 Hermes 独有的差异化渠道。

八、与 OpenClaw 的全面对比

功能对照表

功能	Hermes Agent	OpenClaw
记忆系统	多层（Active + Archive + Honcho），FTS5 检索，~3,300 chars 两文件	每 Assistant 独立隔离记忆
技能系统	47 工具，Agent 自动创建/改进技能	52+ 内置 Skills，文件 precedence
自进化	✅ 任务完成自动写 Skill 文件	❌ 不会自动生成新技能
用户建模	Honcho dialectic 用户建模	❌
部署后端	6 种（local/Docker/SSH/Daytona/Modal/Singularity）	托管 + 云容器
Serverless 休眠	✅ Daytona/Modal 空闲零成本	❌
渠道数量	14+（Signal + Feishu 独有）	主流消息平台
模型支持	200+ via OpenRouter/Nous Portal/Ollama	BYOK：Claude/GPT/Gemini/xAI/Groq/Mistral
MCP 支持	✅ 原生 MCP，stdio + HTTP，动态发现	❌（非原生）
语音模式	✅ 本地 STT（零 API 成本），流式 TTS	❌
技能格式	agentskills.io（开放标准）	专有
隐私/安全	零遥测，容器沙箱	Device pairing，Gateway 认证
RL 训练	✅ Atropos RL 训练支持	❌
批量处理	✅ Batch trajectory 生成	❌
SOUL.md	✅ 原生人格系统	类似但非 Slot #1

互补用法（高级用户）

“Use OpenClaw as the conductor: routing tasks, handling auth, integrating with infra. Use Hermes as the lead specialist: when a task really benefits from long-term memory and learned skills, route it to Hermes via MCP or a custom tool.”

九、适用场景决策树

需要 AI Agent？

├─ 需要多角色团队隔离 + 企业治理 + 5+ 商业渠道
│   └─ → OpenClaw（Gateway 架构天生适合）

├─ 重复性服务业务（agency/咨询/SaaS ops）
│   └─ → Hermes（自动沉淀工作流为技能，越用越强）

├─ 需要 Signal 或 Feishu 渠道
│   └─ → Hermes（OpenClaw 不支持）

├─ 需要本地零成本 STT（语音交互）
│   └─ → Hermes（faster-whisper 本地运行，无需 API key）

├─ 需要 MCP 外部工具生态（GitHub/数据库/内部 API）
│   └─ → Hermes（原生 MCP 支持，动态发现）

├─ 已有成熟 OpenClaw 团队基础设施
│   └─ → OpenClaw（生态成熟，治理完善）

└─ 需要 RL 训练 / 轨迹导出 / 研究工作流
    └─ → Hermes（Atropos RL + Batch Runner 内置）

Hermes Agent 官方文档

本文采用署名-非商业性使用-相同方式共享 4.0 国际许可协议，转载请注明出处。