Hermes Agent 官方文档解读 vs OpenClaw

重要:本篇以官方文档为核心,替代之前仅基于视频描述的版本。信息源优先级:官方文档 > 权威分析 > 视频描述。


一、产品定位

Hermes AgentNous Research(Hermes-3 / Nomos / Psyche 模型家族)开发的开源 AI Agent,MIT 协议,2026 年 2 月发布。

官网:https://hermes-agent.nousresearch.com/
GitHub:约 22,000 Stars

核心理念

“It’s not a coding copilot tethered to an IDE or a chatbot wrapper around a single API. It’s an autonomous agent that gets more capable the longer it runs.”

与 OpenClaw 的核心定位差异

  • OpenClaw = 本地优先的 Agent 编排框架,强项在多渠道集成、团队协作、企业治理
  • Hermes Agent = 自进化个人操作者,强项在长期记忆、自动化学技能、用户偏好建模

二、核心架构(官方)

代码规模

组件 文件 规模
AIAgent(对话循环) run_agent.py ~9,200 行
HermesCLI(交互终端) cli.py ~8,500 行
Gateway(消息网关) gateway/run.py ~5,800 行
配置命令 hermes_cli/main.py ~4,200 行
交互式安装向导 hermes_cli/setup.py ~3,500 行
测试套件 tests/ 3,000+ 测试

6 种终端后端(Terminal Backends)

后端 用途
local 本地机器直接执行
Docker 容器化隔离执行
SSH 远程服务器
Daytona Serverless 持久化
Modal Serverless 持久化
Singularity HPC 容器

Serverless 特性:Daytona 和 Modal 支持休眠——环境空闲时几乎零成本。


三、记忆系统(官方详解)

两层记忆文件

文件 用途 容量
MEMORY.md Agent 的个人笔记:环境事实、约定、学到的教训 2,200 chars (~800 tokens)
USER.md 用户画像:偏好、沟通风格、期望 1,375 chars (~500 tokens)

技能系统(Self-Improving Skills)

Skills 是按需加载的知识文档,遵循 渐进式披露(Progressive Disclosure) 模式。Agent 会在以下时机自动创建技能:

  • 完成复杂任务(5+ 工具调用)后
  • 遇到错误或死胡同并找到可行路径后
  • 用户纠正了 Agent 的方法后
  • 发现非平凡工作流时

四、MCP(Model Context Protocol)集成

支持两种 MCP 服务器

类型 配置方式 适用场景
Stdio(本地子进程) command + args + env 本地安装、低延迟
HTTP(远程端点) url + headers 托管服务、组织内部 MCP

动态工具发现

MCP 服务器可通过 notifications/tools/list_changed 通知 Hermes 工具列表变化,Hermes 自动重新获取并更新注册表,无需手动 reload。


五、语音模式(Voice Mode)

三种语音功能

功能 平台 说明
Interactive Voice CLI Ctrl+B 录音,语音打断,流式 TTS
Auto Voice Reply Telegram, Discord 文字回复同时发送语音音频
Voice Channel Discord 加入 VC,聆听用户发言并语音回复

本地 STT(零 API 成本)

pip install faster-whisper  # 免费,运行本地,约 150MB 模型,首次使用自动下载

六、SOUL.md 人格系统

SOUL.md vs AGENTS.md

用途 SOUL.md AGENTS.md
身份/人格
语气/风格
沟通偏好
项目架构
代码约定
工具偏好
仓库特定工作流

判断标准:如果它应该跟着你到处走 → SOUL.md;如果它属于某个项目 → AGENTS.md


七、14+ 消息平台

官方支持的平台(一个 Gateway,统一体验):

CLI, Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Mattermost, Email, SMS, DingTalk, Feishu, WeCom, Home Assistant

Signal 和 Feishu 是 Hermes 独有的差异化渠道。


八、与 OpenClaw 的全面对比

功能对照表

功能 Hermes Agent OpenClaw
记忆系统 多层(Active + Archive + Honcho),FTS5 检索,~3,300 chars 两文件 每 Assistant 独立隔离记忆
技能系统 47 工具,Agent 自动创建/改进技能 52+ 内置 Skills,文件 precedence
自进化 ✅ 任务完成自动写 Skill 文件 ❌ 不会自动生成新技能
用户建模 Honcho dialectic 用户建模
部署后端 6 种(local/Docker/SSH/Daytona/Modal/Singularity) 托管 + 云容器
Serverless 休眠 ✅ Daytona/Modal 空闲零成本
渠道数量 14+(Signal + Feishu 独有) 主流消息平台
模型支持 200+ via OpenRouter/Nous Portal/Ollama BYOK:Claude/GPT/Gemini/xAI/Groq/Mistral
MCP 支持 ✅ 原生 MCP,stdio + HTTP,动态发现 ❌(非原生)
语音模式 ✅ 本地 STT(零 API 成本),流式 TTS
技能格式 agentskills.io(开放标准) 专有
隐私/安全 零遥测,容器沙箱 Device pairing,Gateway 认证
RL 训练 ✅ Atropos RL 训练支持
批量处理 ✅ Batch trajectory 生成
SOUL.md ✅ 原生人格系统 类似但非 Slot #1

互补用法(高级用户)

“Use OpenClaw as the conductor: routing tasks, handling auth, integrating with infra. Use Hermes as the lead specialist: when a task really benefits from long-term memory and learned skills, route it to Hermes via MCP or a custom tool.”


九、适用场景决策树

需要 AI Agent?

├─ 需要多角色团队隔离 + 企业治理 + 5+ 商业渠道
│   └─ → OpenClaw(Gateway 架构天生适合)

├─ 重复性服务业务(agency/咨询/SaaS ops)
│   └─ → Hermes(自动沉淀工作流为技能,越用越强)

├─ 需要 Signal 或 Feishu 渠道
│   └─ → Hermes(OpenClaw 不支持)

├─ 需要本地零成本 STT(语音交互)
│   └─ → Hermes(faster-whisper 本地运行,无需 API key)

├─ 需要 MCP 外部工具生态(GitHub/数据库/内部 API)
│   └─ → Hermes(原生 MCP 支持,动态发现)

├─ 已有成熟 OpenClaw 团队基础设施
│   └─ → OpenClaw(生态成熟,治理完善)

└─ 需要 RL 训练 / 轨迹导出 / 研究工作流
    └─ → Hermes(Atropos RL + Batch Runner 内置)