Hermes Agent 使用实践:核心机制与命令技巧
Hermes Agent 是 Nous Research 开源的 AI Agent 框架,模型无关、支持多平台。和传统 AI 聊天工具不同,它具备自进化能力——用得越久,积累的技能和记忆越多。本文重点介绍其核心机制和日常使用的命令技巧。
核心机制:它凭什么"越用越聪明"
Hermes 的本质可以用一句话概括:让 AI 自己进化,而不是你当保姆。
传统 AI 工具是你写规则、调参数、加技能,整个过程依赖你持续输入。Hermes 把规则的生成过程自动化——它从经验中总结规则,写进系统。你只需要用,它在使用过程中反向构建自己的结构。
这个"自进化"的核心是一个五步闭环:
记住 → 总结 → 形成技能 → 用技能 → 根据反馈再改
这个循环不是偶尔触发,而是每一轮对话结束后都会发生。你每用一次,它就复盘一次。复盘不是"记录聊天",而是"提炼经验"——只记有用的东西,还会整理结构。
三层记忆:不是"存聊天记录"那么简单
很多人以为 AI 记忆就是存聊天记录。Hermes 搞了三层结构,每层解决一个问题:
| 层级 | 存储内容 | 存放位置 |
|---|---|---|
| 会话记忆 | 发生了什么(对话历史) | SQLite 数据库,按需加载 |
| 持久记忆 | 你是谁(偏好、习惯) | MEMORY.md / USER.md |
| 技能记忆 | 怎么做事(任务流程) | ~/.hermes/skills/ |
会话记忆不会全部加载到上下文,而是需要时再查。不会因为历史太多变卡,也不会因为上下文太长变蠢。
持久记忆会提炼你的习惯、偏好、工作方式。你写代码喜欢什么风格、讨厌什么结构,它都会慢慢总结出来。
技能记忆是最值钱的部分。它把任务流程固化成方法,下次直接调用。就像从"会做一道题"变成"掌握一类题"。
会话管理命令
启动和恢复会话是最基础的操作:
1 | 启动交互式会话 |
会话管理还有 CLI 命令:
1 | hermes sessions list # 列出所有会话 |
对话中的斜杠命令
进入对话后,斜杠命令是最常用的交互方式。命令不区分大小写。
会话控制
| 命令 | 说明 |
|---|---|
/new |
开始新对话 |
/retry |
重试上一条回复 |
/undo |
撤销上一步操作 |
/compress |
手动压缩上下文(上下文接近满时自动触发) |
/rollback |
回滚文件改动(需启动时加 --checkpoints) |
/title <标题> |
设置会话标题 |
模型与推理
| 命令 | 说明 |
|---|---|
/model |
查看当前模型 |
/model <provider:model> |
临时切换模型 |
/reasoning high |
提高推理强度(复杂任务时使用) |
/reasoning off |
关闭推理(节省 token) |
记忆管理
| 命令 | 说明 |
|---|---|
/memory_add <内容> |
永久保存信息到记忆 |
/memory_remove <内容> |
删除记忆 |
/search_sessions <关键词> |
搜索历史会话 |
/recent |
查看最近会话 |
记忆的价值在于减少重复说明。你纠正一次,它就记住一次。用得越久,需要纠正的越少。
信息查看
| 命令 | 说明 |
|---|---|
/help |
帮助信息 |
/usage |
查看 token 用量和费用明细 |
/tools |
列出可用工具 |
/skills |
列出已加载技能 |
/insights --days 7 |
生成周报:学习的技能、高频调用、重复任务模式 |
/verbose |
切换显示模式(off → new → all → verbose) |
/insights相当于 AI 员工的"绩效考核",可以观察它的成长轨迹。
文件与终端操作
| 命令 | 说明 |
|---|---|
/read <文件路径> |
读取文件(带行号) |
/write <文件路径> <内容> |
覆盖写入文件 |
/patch <文件路径> <旧文本> <新文本> |
查找替换 |
/search <模式> |
搜索文件内容或文件名 |
/term <命令> |
执行 shell 命令 |
/exec <Python代码> |
执行 Python 代码 |
浏览器操作
| 命令 | 说明 |
|---|---|
/nav <URL> |
导航至网页 |
/click <元素> |
点击页面元素 |
/type <元素> <文本> |
在输入框中填写文本 |
/snap |
获取页面快照 |
/vision <问题> |
对当前页面进行视觉分析 |
/browser connect |
连接本地浏览器 |
技能系统:会自己进化的"经验文档"
技能(Skill)不是静态模板,而是会根据使用反馈自动修改的经验文档。
传统 Skill 是人写、人改,人不动它就不变。Hermes 的 Skill 会根据你的反馈自动修改。你说一句"这里不对",它不只是这次改,还会更新未来的做法。一个写代码的 Skill,用一周和用三周,完全不是一个水平。
技能管理命令:
1 | 对话中 |
技能覆盖 16 个方向,包括 GitHub 工作流、学术研究、创意生成、机器学习、生产力工具等。开始任务前先用 /skills 检查是否有现成技能,是最实用的习惯。
定时任务(Cron)
Hermes 内置 cron 子系统,支持用自然语言描述任务:
1 | 对话中创建 |
时间格式灵活:'30m'(30分钟)、'every 2h'(每2小时)、'0 9 * * *'(每天9点)。
安全约束:定时任务不能递归创建新的定时任务,防止失控。
子代理与并行任务
复杂任务可以委派给子代理并行处理:
1 | /delegate <目标> # 委派单个任务 |
每个子代理有独立的上下文和终端会话,互不干扰。并发子代理上限为 3 个,且工具权限受限,防止失控。
其他实用命令
后台任务
1 | /background <提示> # 在后台独立会话中运行任务 |
适合长时间运行的研究任务,可以边等结果边做其他事情。
人格切换
1 | /personality pirate # 切换为海盗风格 |
也可以编辑 ~/.hermes/SOUL.md 自定义 Agent 的说话风格和性格。
语音模式
1 | 安装语音支持 |
配置管理
1 | hermes config # 查看当前配置 |
多实例隔离
1 | hermes profile create NAME # 创建独立空间(配置、记忆、技能互不干扰) |
键盘快捷键
| 按键 | 说明 |
|---|---|
Enter |
发送消息 |
Alt+Enter / Ctrl+J |
换行(多行输入) |
Ctrl+C |
中断 Agent(2秒内按两次强制退出) |
Ctrl+D |
退出 |
Tab |
接受自动补全或斜杠命令 |
状态栏说明
对话界面底部的状态栏实时显示:
1 | mimo-v2.5-pro | 12.4K/200K | [██████░░░░] 6% | $0.06 | 15m |
分别是:模型名称 / token 用量 / 上下文进度条 / 预估费用 / 会话时长。
上下文进度条的颜色含义:
- 绿色(< 50%):空间充足
- 黄色(50-80%):接近满
- 橙色(80-95%):即将到限
- 红色(≥ 95%):需要压缩,用
/compress
实用技巧总结
- 技能优先:开始任务前先用
/skills检查现有技能 - 记忆持久化:用
/memory_add保存关键信息,跨会话复用 - 会话搜索:用
/search_sessions查找历史解决方案 - 合理委派:复杂推理任务交给
/delegate,简单操作自己做 - 定时自动化:重复性工作用
/cron_create设定周期任务 - 文件回滚:启动时加
--checkpoints,改动前自动 git commit,随时/rollback - 谨慎使用
/yolo:跳过危险命令确认,调试后务必关闭 - Docker 隔离:
hermes config set terminal.backend docker,在容器中运行命令更安全
需要注意的问题
Hermes 的自动化很强,但不是"什么都不管就能变神"。
它的进化质量取决于你的使用方式。反馈模糊,它学得也模糊;要求清晰,它进化就快。记忆可能会记错、理解偏、甚至形成错误习惯,需要偶尔检查和修正。
这不是完全自动驾驶,而是"高自动化 + 人类监督"。它是个会成长的系统,但你仍然是方向盘。
参考资料:
Hermes Agent 官方文档
GitHub - NousResearch/hermes-agent
Hermes Agent 从入门到精通
Hermes Agent Guide - Analytics Vidhya
Hermes Agent Deep Dive - DEV Community
Hermes Agent 完整指南 - 知乎
80+ 条命令和用法 - 知乎
Hermes Agent CLI - 菜鸟教程

