Nous Researchが公開した「Hermes Agent」が、公開から2か月でGitHubスター10万超を記録し、海外では「OpenClawだけ追っているのは機会損失」とまで言われ始めています。普通のAIエージェントが「セッションを閉じた瞬間に全部忘れる」のに対し、Hermes Agentは使うほど自分専用に賢くなり、自分でスキルを書き、自分で書き換える──そんな自己進化型エージェントです。本記事では、AIエージェント初心者でも理解できる比喩から始め、OpenClawとの設計思想の決定的な違い、3層メモリ・SOUL.md・GEPA最適化・複数エージェント運用まで、実装に踏み込んで徹底解説します。
- Hermes Agentとは何か:たった3分で核心がわかる比喩での説明
- OpenClawとの根本的な違い:「向き」が真逆である理由
- 普通のAIエージェントが抱える「セッション忘却問題」と、Hermesの解決アプローチ
- SOUL.md(アイデンティティ層)・3層メモリ・自己進化スキル・Curator・GEPAの全構造
- 2分でセットアップする具体的手順とTelegram連携
- 1人から10人へ:プロファイルで複数エージェントを運用する方法
- Claude Code連携でプログラマーエージェントを最強化する方法
- 自然言語で書ける組み込みcron:日次ダイジェスト自動配信の作り方
- Hermes Agent / OpenClaw / Claude Code の用途別使い分けフロー
- 導入すべき人 / 見送るべき人の判断基準
そもそもAIエージェントとは何か?普通のChatGPTとの違いを3分で
本題に入る前に、AIエージェントに不慣れな方のために前提を整理します。すでにOpenClawやClaude Codeを触っている方は、この章は読み飛ばしても構いません。
ChatGPT・Claudeなどの「チャットAI」との決定的な違い
ChatGPTやClaudeとの会話は、基本的に「あなたの質問に答える」ことに留まります。コードを書いてくれと頼めばコードを返してくれますが、そのコードをファイルに保存したり、テストを実行したり、Gitにコミットしたりは「あなたが」やります。
AIエージェントは違います。「テストが落ちているから直して」と頼むだけで、AIが自分でファイルを開き、コードを読み、修正し、テストを走らせ、結果を見て、必要なら再修正する──この一連の作業をAI自身が完結させます。
チャットAIは「賢い相談相手」。質問すれば的確に答えてくれるが、実際に動くのはあなた。
AIエージェントは「賢い部下」。「これやっといて」と頼めば、自分で考えて作業を完了させて報告してくれる。
普通のAIエージェントが抱えている深刻な問題
AIエージェントは確かに便利ですが、1つだけ致命的な弱点があります。
コーディングの好み、プロジェクトの規約、3回も指摘して直してもらったこと、昨日10分かけて見つけた修正方法──すべて消えます。次のセッションでは、またゼロからやり直しです。
たとえば「うちのプロジェクトでは関数はarrow functionで書いて、typeじゃなくinterfaceを使って」と毎回説明する必要がある。同じバグの直し方を3回も教えても、4回目にまた同じミスをしてくる。これがいまのAIエージェントの限界です。
Hermes Agentとは何か:「使うほど自分専用に賢くなる」エージェント
Hermes Agentは、米国のAI研究組織Nous Researchが2026年2月にオープンソース公開した、自己進化型のAIエージェントです。公開からわずか2か月でGitHubスター10万超を達成し、AIエージェント界隈で最も急成長しているプロジェクトの1つになっています。
Hermes Agentの核心:3つの能力を1つに統合
Hermes Agentが他のエージェントと違うのは、普通なら別々に存在する3つの能力を1つのフレームワークに同居させたことです。
- ランタイム時のスキル学習:エージェント自身が「うまくいったやり方」をスキルとして書き残し、次回以降に再利用する
- 3層構造の永続メモリ:セッションをまたいで「あなたのこと」と「プロジェクトのこと」を覚え続ける
- GEPA最適化パイプライン:オフラインで実行ログを分析し、スキルを「進化」させる
「この3つすべてを載せたオープンソースエージェントは他にない」──Nous ResearchおよびAkshay Pachaar氏(LightningAI出身、BITS Pilani卒、3つの特許保有)の言葉。OpenClawでさえ、ここまでは揃えていません。
普通のAIエージェントは「毎日記憶が消える新人」。同じ説明を毎日繰り返す必要がある。
Hermes Agentは「あなたと一緒に成長する部下」。最初は教える必要があるが、教えたことを覚え、自分でメモを取り、自分のマニュアルを更新していく。1年後には「あなたの仕事の文脈を熟知した秘書」になっている。
OpenClawとの決定的な違い:「向き」が真逆である
「OpenClawとどう違うのか?」これが多くの読者が最も知りたい点でしょう。両者を比較すると、表面的には似ていますが、設計思想が真逆です。
1行で言うと
「Hermesは”学習するエージェント“の周りにゲートウェイ(メッセージング窓口)を巻きつけた。OpenClawは”メッセージングゲートウェイ“の周りにエージェントを巻きつけた。」
Hermes Agent
主役:内部の学習ループ
発想:「自己進化するエージェントを作って、入口(Telegram等)を後付けする」
強み:スキル自動生成・3層メモリ・GEPA最適化など、エージェント自体の知性向上に特化
OpenClaw
主役:メッセージング統合
発想:「メッセージング体験を作って、そこにエージェントを差し込む」
強み:Slack・Discord等の主要チャットツールとの深い統合、チーム運用
機能比較表
| 項目 | Hermes Agent | OpenClaw |
|---|---|---|
| 提供元 | Nous Research | OpenClaw Project |
| ライセンス | MIT | MIT |
| GitHub Star(2026年5月時点) | 10万+ | 同等規模 |
| スキル自己生成 | ○(核心機能) | × |
| 永続メモリ | 3層構造(MD+SQLite+外部) | あり(より単純) |
| アイデンティティ層 | SOUL.md | — |
| オフライン最適化 | GEPAパイプライン | × |
| メッセージング対応数 | 15+ | 主要チャットに深い統合 |
| 複数エージェント運用 | Profileシステム | あり |
| モデル切り替え | Claude / GPT / Gemini / Ollama | 同等 |
| セットアップ難易度 | ★★☆(ワンライナー) | ★★☆ |
| 得意な用途 | 個人専用エージェント、長期運用、自己進化 | チームでのメッセージング業務、社内Bot |
使い分けの結論
✓ Hermes Agentを選ぶべき人
- 「自分専用のAI部下」を時間をかけて育てたい
- 使うほど学習・進化していく構造に興味がある
- 個人開発・1人会社で長期運用したい
- スキルやメモリをカスタマイズしたい技術志向の人
- Claude Codeと組み合わせて開発相棒にしたい
✓ OpenClawを選ぶべき人
- チーム全員でSlackやDiscord経由でAIを使いたい
- メッセージング体験の完成度を重視する
- 「育てる」より「すぐ使える」を優先
- 社内Bot・カスタマーサポート用途
HermesとOpenClawは競合ではなく、用途が異なります。個人の開発相棒はHermes、チームのメッセージング業務はOpenClawという棲み分けが現実的です。
Hermes Agentのアーキテクチャ全体像
ここから技術的な内部構造に踏み込みます。エンジニア向けの章ですが、初心者の方も比喩で追えるよう解説します。
全体構造はたった1つのクラスに集約されている
Hermesの全体は、run_agent.pyの中にある1つのAIAgentクラスを中心に動いています。CLI、メッセージング、バッチランナー、IDE連携──これらすべてが、同じコアエージェントの「入口」に過ぎません。だから「プラットフォーム非依存」が、実装としても成立しています。
│ 入口(プラットフォーム非依存) │
│ CLI / Telegram / Discord / Slack / IDE │
└──────────────────┬──────────────────────────┘
↓
┌─────────────────────────────────────────────┐
│ AIAgent クラス(run_agent.py) │
│ ┌───────────────────────────────┐ │
│ │ ReAct系の同期ループ │ │
│ │ ① システムプロンプト構築 │ │
│ │ ② 圧縮チェック │ │
│ │ ③ API呼び出し(割り込み可能) │ │
│ │ ④ ツール呼び出し実行 │ │
│ │ ⑤ ループ │ │
│ └───────────────────────────────┘ │
└──────────────────┬──────────────────────────┘
↓
┌─────────────────────────────────────────────┐
│ 実行先(6種類から選択) │
│ Local / Docker / SSH / Modal / Daytona / │
│ Singularity │
└─────────────────────────────────────────────┘
後で効いてくる3つの細部
ローカルターミナル、Docker、SSH、Modal、Daytona、Singularityのいずれかを設定1つで切り替えられる。同じコードのまま、実行場所をノートPCからクラウドGPUサーバーに移すことが、コードを一切いじらずに可能です。
3種類のAPIフォーマットに翻訳するレイヤーがあるため、Claude・GPT・Gemini・ローカルOllamaへの切り替えがコマンド1つで完結。何も壊れません。Anthropicが値上げしたらOpenAIに切り替える、なども簡単です。
ループに陥ったエージェント(失敗するAPIをリトライし続ける、同じファイルを読み続けるなど)が、こっそりクレジットを焼き尽くす事故を防ぐためです。サブエージェントも同じ予算枠で動くため、委任の連鎖が暴走することもありません。
SOUL.md:アイデンティティ層──「Hermesは誰なのか」を決める
メモリやスキルの話に入る前に、その上に乗る層があります。「アイデンティティ」です。
なぜアイデンティティ層が必要か
メモリは「何を知っているか」、スキルは「どうやるか」を扱います。しかしこの2つだけでは、エージェントが現れたときに「誰なのか」がブレてしまう。同じエージェントが毎回違う帽子をかぶっているように見えてしまうわけです。
HermesはここをSOUL.mdという1つのファイルで解決しています。
SOUL.mdは「固定された額縁」、メモリとスキルは「その中で動く部品」。額縁が決まっていれば、中身が変わってもブレない人格を保てる。
SOUL.mdの動作
- 配置:
~/.hermes/SOUL.md - 読み込み:システムプロンプトの一番最初(スロット#1)、他のすべてが読み込まれる前
- 記述内容:性格・トーン・コミュニケーションスタイル・絶対やらないこと
- 性質:手書きで静的、一度書いて時々調整するだけ
- フォールバック:ファイルがなければ組み込みのデフォルト人格を使用
プロジェクトが変わってもセッションが変わっても、性格は固定されたまま動きます。エージェントが書く記憶、生み出すスキル、知識整理の仕方──すべてがこのアイデンティティのレンズを通して行われるからです。
3層メモリシステム:3つの階層、3つの速度
Hermesには単一の「メモリ」がありません。3つの層に分かれていて、それぞれ目的と容量・速度が違います。
Tier 1:2つの小さなMarkdownファイル(常時コンテキスト)
MEMORY.md(最大2,200文字)+ USER.md(最大1,375文字)
MEMORY.md:環境・プロジェクトの規約・ツールの癖・学んだ教訓など、エージェントが「自分のために書いたメモ」。
USER.md:あなた自身のプロフィール。名前、コミュニケーションの好み、習熟レベル、避けてほしいことなど。
動作:両方ともセッション開始時にシステムプロンプトに「固定スナップショット」として注入される。途中で新しいメモリが書き込まれてもディスクには即保存されるが、システムプロンプトに反映されるのは次のセッションから。
メモリがおおむね80%まで埋まると(システムプロンプトのヘッダーにパーセンテージで表示)、エージェントは「圧縮」を実行します。関連するエントリを統合し、より情報密度の高いバージョンに書き直す。結果として本当に有用な情報だけが残ります。
Tier 2:全会話の全文検索(オンデマンド)
SQLite + FTS5による全文検索
CLIとメッセージング、両方の会話がすべてSQLiteに保存され、FTS5でフルテキスト検索できます。エージェントはここから何週間も前の会話を検索可能です。
トレードオフ:Tier 1は常にコンテキストに入っているが容量小。Tier 2は容量無限だが、検索実行とLLMによる要約が必要。クリティカルな事実はTier 1、それ以外はTier 2をオンデマンド検索──これが棲み分けです。
Tier 3:外部メモリプロバイダ(8種類のプラグイン)
8種類のプラグイン可能な外部プロバイダ
さらに深い永続メモリのために、Hermesは8種類のプラグイン可能な外部プロバイダを同梱しています。組み込みメモリと「並走」する形で動き、置き換えるわけではありません。同時にアクティブにできるのは1つだけ。
いずれかの外部プロバイダがアクティブだと、Hermesは自動的に:
- 各ターン前に、関連メモリをプリフェッチ
- 各レスポンス後に、会話ターンをシンク
- セッション終了時に、メモリを抽出
Tier 1=デスクの上の付箋(毎回見るが場所がない)
Tier 2=引き出しの中の書類(取り出す手間はあるが量を入れられる)
Tier 3=外部倉庫(特化用途、必要に応じて契約)
自己進化するスキル:エージェント自身が書く手順書
メモリは「事実」を扱う層でした。スキルは「やり方」を扱う層です。これがHermes最大の特徴です。
スキルの構造
スキルはYAMLフロントマター付きのMarkdownファイルで、エージェントの「手続き的記憶」として機能します。何を知っているかではなく、どうやるかを記録します。
---
name: k8s-pod-debug
description: >
Activate for crashing pods, CrashLoopBackOff,
"why is my pod restarting", container failures.
version: 1.2.0
author: agent
platforms: [linux, macos]
---
## Procedure
1. Get pod status → check events → pull logs
2. Look for OOMed, ImagePullBackOff, config errors
## Pitfalls
- Forgetting --previous flag on restarted containers
## Verification
- Pod stays Running with 0 restarts for 5+ minutes
name、description、version、author、platformsがフロントマターに並び、本文に手順(Procedure)/落とし穴(Pitfalls)/検証(Verification)が並びます。エージェントが「自分のためのレシピ」を残す感覚です。
段階的開示(Progressive Disclosure)でトークン爆発を防ぐ
スキルが何百個になってもコンテキストを圧迫しない仕組みが「段階的開示」です。
| レベル | 読み込み内容 | トークン消費 |
|---|---|---|
| レベル0 | 名前と説明だけ | カタログ全体で約3,000トークン |
| レベル1 | 必要になったときにスキル本文をロード | そのスキル分のみ |
| レベル2 | スキル内の特定の参照ファイルにさらに踏み込む | 必要な参照分のみ |
スキル作成のトリガー
エージェントはskill_manageツールを使って、自分でスキルを作ります。トリガーは次の場面です。
- 5回以上ツールを呼ぶような複雑なタスクを完了したとき
- エラーやデッドエンドにぶつかった後、動く道筋を見つけたとき
- ユーザーがアプローチを修正したとき
- 自明でないワークフローを発見したとき
ループはこう動きます:
問題に遭遇 → 試行錯誤して解く → うまくいったやり方をSKILL.mdとして保存 → 次に似た問題に出会ったらゼロから再発見せずに済む
skill_manageの6つのアクション
create:新規作成patch:部分修正(トークン効率が良いので推奨)edit:全書き換えdelete:削除write_file:補助ファイル書き込みremove_file:補助ファイル削除
Curator:スキル庫を勝手に片付けてくれる司書
何もしないと、エージェントが作ったスキルは際限なく積み重なります。狭くて重複した手順書が大量にでき、トークンを浪費し、カタログを汚していく。これを掃除するのが「Curator」です。
Curatorの起動条件
cronデーモンではなく、「非アクティブチェック」で起動します。最後の実行から7日経過 + エージェントが2時間以上アイドルのとき、エージェントのバックグラウンドフォークが立ち上がり、アクティブな会話には一切触らずに動きます。
2段階の動作
30日使われていないスキルはstaleに。90日使われていないスキルはarchiveに回されます。
フォークされたエージェントが、エージェント自身が作ったスキル群を眺めて、各スキルに「keep(残す)」「patch(修正)」「consolidate(統合)」「archive(保管)」のどれにするかを判断します。
絶対に壊さない2つの制約
- バンドル済みスキル・Hubからインストールされたスキルには絶対に触れない。エージェント自身が作ったものだけが対象
- 自動削除は一切しない。最悪のケースでも
~/.hermes/skills/.archive/への退避にとどまり、コマンド1つで復元可能
さらに、Curatorが走る前には毎回スキルディレクトリ全体のtar.gzスナップショットを取ります。ロールバックはコマンド1つ。しかもロールバック自体も再度ロールバック可能です。
「このスキルだけは絶対消すな」というものがあれば、hermes curator pin <skill>でピン留めしておけば、アーカイブも削除もされません。パッチや編集は通るので、ピン留めしたまま改善は受けられます。
GEPA:実行ログから「実際に効くスキル」を進化させる
ここから一段深い話に入ります。エンジニア向けの章ですが、概念は重要なので追ってみてください。
なぜGEPAが必要か:エージェントの自己評価は甘い
エージェント内蔵の学習ループ(スキル作成+Curator)には、よく知られた弱点があります。
実際には大したことがなくても「うまくやれた」と判定しがち。コミュニティのフィードバックでもこの傾向は確認されています。スキルを自動生成するのと同じ仕組みが、手動でカスタマイズした良いバージョンを、劣化したバージョンで上書きしてしまうこともあります。
ここで登場するのがGEPA(Genetic-Pareto Prompt Evolution)です。
GEPAの位置付け
- Hermesランタイムには組み込まれていない(オフラインの最適化パイプライン)
- 別リポジトリ:
NousResearch/hermes-agent-self-evolution - ICLR 2026のOral採択論文として発表、MITライセンスで公開
中心アイデア
エージェントに「うまくいったか?」と尋ねるのではなく、実行ログ(execution trace)を直接読んで「なぜ失敗したのか」を理解し、進化的探索でターゲットを絞った改良案を提案する。
パイプラインの流れ
Hermesリポジトリから対象スキルを取得
Claude Opusで合成テストケース、SQLiteから実セッション履歴、または手作りのゴールデンセット
実行ログを読む → 失敗箇所を理解する → 候補バリアントを生成
バイナリ合否ではなくルブリック評価(複数観点での質的評価)
全テストスイートが100%通過、スキルは15KB以内、キャッシュ互換性を保つ、本来の意味的目的からズレない
Hermesリポジトリへの「PR」として送る。直接コミットは絶対にしない。人間レビューを必ず挟む
GPUは要りません。すべてAPI呼び出しで完結。コストは1回の最適化につき$2〜$10。フルファインチューニング(RLやGRPO)に時間とお金を投じる前に試す価値があります。Akshay氏の関連解説によると、Berkeleyのチームが35倍少ないロールアウトでGPU学習なしにGRPOを10ポイント上回った事例も。
2分でセットアップする
ここから実際にHermes Agentを動かす手順に入ります。要件はシンプルです。
- Linux、macOS、WSL2 のいずれか
- Python 3.11+(インストーラに同梱)
- APIベースの利用なら8GB RAMで十分
ステップ1:ワンラインインストール
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc # zshなら ~/.zshrc
ステップ2:セットアップウィザード
hermes setup
プロバイダ(Anthropic / OpenAI / OpenRouter / Ollamaなど)、APIキー、モデル、ツールを順に聞いてくれます。
ステップ3:ターミナルで会話開始
hermes
ステップ4:Telegramに接続(オプション)
@BotFatherに/newbotを送ってBotトークンを取得@userinfobotで自分のTelegram User IDを取得- 設定にそれぞれ入力
これでスマホからエージェントと話せる状態になります。
~/.hermes/ ディレクトリ構造
インストール直後、ホームディレクトリに新しいフォルダができます。レイアウトを把握しておくと、後の作業がすべて腹落ちします。
~/.hermes/
├── config.yaml # メイン設定
├── .env # APIキー
├── auth.json # OAuth認証情報
├── SOUL.md # エージェントの人格(スロット#1)
│
├── memories/
│ ├── MEMORY.md # エージェントが残す事実
│ └── USER.md # ユーザーモデル
│
├── skills/ # 全スキル(同梱・Hub・自動生成)
│ ├── mlops/
│ ├── devops/
│ └── .hub/ # Skills Hubの状態
│
├── sessions/ # プラットフォーム別セッションメタデータ
├── state.db # FTS5付きSQLiteセッションストア
├── cron/
│ ├── jobs.json # スケジュールジョブ
│ └── output/ # cron実行出力
│
├── plugins/ # カスタムプラグイン
├── hooks/ # ライフサイクルフック
└── skins/ # CLIテーマ
Skills Hub:687個の既存スキルを使う
Hermesは公式の「Skills Hub」を持っていて、18カテゴリで687個のスキルが用意されています。ゼロから自分で作る必要はありません。
| カテゴリ | 個数 | 備考 |
|---|---|---|
| 組み込みスキル | 87個 | デフォルトで利用可能 |
| オプションスキル | 79個 | ON/OFF切替可 |
| Anthropic製 | 16個 | frontend-design、pdf、pptx、docx、mcp-builderなど |
| LobeHubコミュニティ拠出 | 505個 | 幅広いコミュニティ貢献 |
任意のGitHubリポジトリを「タップ」として追加することもできます。
hermes skills tap add yourname/your-skills-repo
hermes skills install yourname/your-skills-repo/<skill-name>
これがチーム内でスキルを共有したり、自社用のプライベートコレクションを保守したりする方法です。
1人から10人へ:プロファイルで複数エージェントを運用する
エージェント1人運用でも便利ですが、Hermesが本当に面白くなるのは専門特化したエージェントを複数並走させたときです。
プロファイルとは
「プロファイル」がそのためのファーストクラス機能です。各プロファイルが完全に独立したHermesインスタンスで、自分専用のconfig、メモリ、スキル、セッション、SOUL.mdを持ちます。デフォルトでは互いに何も共有しません。
3人チームの作成例
ここでは「デザイナー」「プログラマー」「リサーチャー」の3人チームを作ります。
# チーム作成(--cloneで初期configをコピー)
hermes profile create designer --clone
hermes profile create programmer --clone
hermes profile create researcher --clone
# 確認
hermes profile list
それぞれに専用Telegram Botを与える
Telegramはトークン1つにつき1接続しか許さないため、Botを使い回すと壊れます。プロファイルごとに分ける必要があります。
BotFatherで/newbotを3回実行してトークンを3つ取り、プロファイルごとにゲートウェイセットアップを走らせます。
hermes -p designer gateway setup
hermes -p programmer gateway setup
hermes -p researcher gateway setup
SOUL.mdでそれぞれに人格を与える
ここでSOUL.mdが本領を発揮します。3人のエージェントを「中身は同じHermesなのに別人」にする層です。
例1:プログラマー ~/.hermes/profiles/programmer/SOUL.md
# Soul
You are my staff engineer. Terse, direct, pragmatic.
You read code before you write code. You write the smallest change
that solves the problem. You prefer standard library over dependencies,
boring tech over shiny tech, and explicit over clever.
Always check: does this already exist in the codebase? Are there
tests? What breaks if this fails? Run the tests before saying "done."
意訳:「私のスタッフエンジニア。簡潔、直接、実務的。書く前に読む。問題を解く最小限の変更を書く。標準ライブラリを依存に優先し、地味な技術を派手な技術に優先し、明示的を”賢い”より優先する。常に確認しろ:コードベースに既に存在しないか?テストはあるか?失敗したら何が壊れるか?”done”と言う前にテストを走らせろ」
例2:リサーチャー ~/.hermes/profiles/researcher/SOUL.md
# Soul
You are my deep researcher for the AI and machine learning space.
Your main job is a daily Telegram digest of what's new and what
matters.
Cover four streams: trending GitHub repos, big tech and lab
announcements, fresh research papers, and the social pulse on X,
Reddit, and Hacker News. Lead with what changed since yesterday.
Cite every claim with a URL. Flag when signal is thin.
Use delegate_task aggressively to parallelize across streams. Never
state a contested claim as settled. Never fabricate a citation.
意訳:「AI・機械学習領域の深掘り担当。主な仕事は毎日のTelegramダイジェスト。4ストリームをカバー:GitHubトレンド/大手テック・ラボの発表/新しい論文/X・Reddit・HNの社会的反応。昨日からの変化を最初に提示する。全主張にURLで出典をつける。シグナルが薄いときはそう明示する。delegate_taskを積極的に使ってストリームを並列処理する。争点のある主張を確定事項として書くな。出典を捏造するな」
プログラマーをClaude Code連携で最強化する
プログラマー役は、「自分でコードを書く」のではなく「Claude Code CLIに実行を委任する」設計にすると本当に強くなります。Hermesはオーケストレーション(指揮)に徹し、Claude Codeがファイル編集・コマンド実行・git管理を担当します。
Hermesが「プロジェクトマネージャー」、Claude Codeが「実装エンジニア」。Hermesは何をすべきか判断し、Claude Codeに指示を出す。実装の細部はClaude Codeが担当し、結果をHermesが受け取って次の手を判断する。
セットアップは1メッセージで完了
セッションを開いて、この1通のアクティベーションプロンプトを送るだけです。
I already have a Claude Max subscription. You are my staff engineer who
helps me with my day-to-day coding tasks, and under the hood you use
Claude Code for all the executions. Set yourself up accordingly.
これでプログラマーは自動的にautonomous-ai-agents/claude-codeスキルをインストールし、claudeバイナリがPATHにあることを確認したうえで、それを実行に使い始めます。次のメッセージから、ファイル読み込み・コード書き込み・テスト実行・コミット・プッシュなど「コード関連のすべて」が、裏ではClaude Code経由で動くようになります。
- アクティベート前に
claudeがPATHに通っていること。which claudeで実バイナリのパスが返ればOK - Claude Codeには「printモード(ワンショット、高速、TUIなし)」と「インタラクティブモード(フルtmuxセッション)」があり、プログラマーがタスクに応じて自動で選び分ける。考えなくて良い
LIF TechではGemini CLIの使い方やDeepSeek V4 ProのClaude Code連携でも、コーディング系AIエージェントの実務的な使い方を解説しています。あわせて参照ください。
デザイナーをカスタマイズ:自分のビジュアル様式を学ばせる
デザイナーが本当に役立ち始めるのは、汎用的なAI画像ではなく「あなたのスタイル」で生成できるようになったときです。
パターン:リファレンスを見せて、スキルを自分で書かせる
手作業でスキルを書く代わりに、良い例を見せて、パターンをエージェント自身にコード化させる──これが自己改善ループを「セットアップ手段」として使う面白いところです。
デザイナーのセッションを開いて、参照画像をドラッグ&ドロップ(TelegramならBotに添付)し、このプロンプトを送ります。
Carefully study these reference illustrations. Note the color palette,
line weight, level of detail, composition, and overall aesthetic.
I want you to create a new skill called "my-design-style" that captures
this visual style. The skill should:
1. Document the style fingerprint in plain language (palette, line
weights, composition rules, recurring motifs)
2. Include a Python script that takes a text description of a new
illustration and generates the image using the Nano Banana model
(google/gemini-2.5-flash-image) via the OpenRouter API in this style
3. Read OPENROUTER_API_KEY from the environment
Use skill_manage to create it. Test the generated script on a sample
prompt before saying it's done.
デザイナーは参照を分析し、SKILL.mdを書き、Pythonスクリプトを生成し、~/.hermes/profiles/designer/skills/my-design-style/に保存し、サンプルプロンプトでスクリプトを実行して動作確認するところまで自走します。
このパターンは画像だけのものではありません。リファレンスを与え、エージェントに「これと同じパターンを再現するスキル」を作らせる──ニュースレターの導入文、Xスレッド、コードレビューコメントなど、一貫性が欲しいあらゆる出力に応用できます。
仕事をスケジュールする:自然言語で書ける組み込みcron
リサーチャーに「毎日のTelegramダイジェスト」を出させるには、スケジュール実行が必要です。Hermesにはそのための組み込みスケジューラがあります。
動作の仕組み
- ゲートウェイデーモンが60秒ごとにチェック
- 期限に達したジョブを独立したエージェントセッションで実行
- 指定したメッセージングプラットフォームに結果を届ける
- ジョブは再起動を超えて生き残る(
~/.hermes/cron/jobs.jsonに保存) - 出力は
~/.hermes/cron/output/に残る
cron式を書く必要がない
面白いのは、cron式を書かなくていいことです。やってほしいことを自然言語(英語または日本語)で記述すれば、Hermesがcron式に変換してくれます。
リサーチャーの日次ダイジェスト設定例
リサーチャーとのセッションを開いて、このプロンプトを送るだけです。
Every weekday at 8am India time, prepare a deep digest of what's new
in the AI and machine learning space over the last 24 hours. Cover
four streams in this order:
1. Trending GitHub repos (especially new AI/ML tooling)
2. Big tech and lab announcements (Anthropic, OpenAI, Google, Meta,
xAI, Nous, etc.)
3. Fresh research papers worth reading
4. Social pulse from X, Reddit, and Hacker News
Lead with what changed since yesterday. Cite every claim with a URL.
Keep it under 800 words. Deliver to Telegram.
Set this up as a recurring cron job.
リサーチャーは自身のcronjobツールでジョブを作成し、配信先を現在のチャット(このケースではTelegram)にデフォルト設定し、あとはスケジューラに任せます。
確認は1コマンド:
hermes -p researcher cron list
登録ジョブと次回実行時刻が表示されます。翌朝8時、Telegramが光ってダイジェストが届きます。ここから先、あなたは何もしなくて良い。
cronのその他の便利パターン
| パターン | コマンド例 | 用途 |
|---|---|---|
| ワンショット遅延 | /cron add 30m "Check the build" |
30分後に1回だけ走る |
| 定期インターバル | /cron add "every 2h" "Check server" |
2時間ごと |
| 標準cron式 | /cron add "0 9 * * 1-5" "..." |
平日9時など正確な制御 |
| スキル添付 | /cron add "every 1h" "Summarize" --skill blogwatcher |
実行前にスキルをロード |
さらにcontext_fromフラグを使えば、あるcronの出力を次のcronの入力にチェーンすることもできます。「リサーチフェーズの結果をライティングフェーズの入力にする」といった多段階自動化に重宝します。
Hermes Agent vs Claude Code vs OpenClaw 用途別使い分け
3つのツールを並べて、どれを選ぶべきかを整理します。
機能・特徴の比較
| 項目 | Hermes Agent | Claude Code | OpenClaw |
|---|---|---|---|
| 提供元 | Nous Research | Anthropic | OSS |
| 提供形態 | CLI + メッセージング + IDE | CLI主体 | メッセージング主体 |
| 自己進化スキル | ○(核心機能) | △(限定的) | × |
| 3層メモリ | ○ | △(簡易) | ○(単純) |
| SOUL.md相当 | ○ | CLAUDE.md | — |
| モデル切り替え | Claude/GPT/Gemini/Ollama | Claude固定 | 同等 |
| コーディング能力 | △(Claude Code連携で強化) | ◎ | △ |
| メッセージング統合 | 15+ | △ | 深い統合 |
| セットアップ難易度 | ★★☆ | ★☆☆ | ★★☆ |
| 料金 | API従量(モデル選択次第) | Claude Max契約 | API従量 |
判断フロー
Q1:そもそも「コードを書かせる」のがメインか?
→ Yes → Claude Codeを中心に据える(必要に応じてHermesでオーケストレーション)
→ No → Q2へ
Q2:「自分専用に進化する個人秘書」が欲しいか?
→ Yes → Hermes Agentを選ぶ
→ No → Q3へ
Q3:「チームでSlack/Discord経由で使う」のがメインか?
→ Yes → OpenClawを選ぶ
→ No → Q4へ
Q4:複数の役割を1人で運用したい(個人開発・1人会社)?
→ Yes → Hermes AgentのProfile機能でデザイナー・プログラマー・リサーチャーを並走
→ No → 用途が明確でないなら、まずClaude Codeから始める
Hermes Agentを導入すべき人 / 見送るべき人
✓ Hermes Agentを即導入すべき人
- 個人開発者・1人会社で、AIに長期的に文脈を渡して育てたい
- 毎回同じ説明をAIにする手間を省きたい
- 複数の役割(リサーチ・コーディング・デザイン等)を1人で運用したい
- Claude CodeやOpenClaw経験者で、次のレベルに行きたい
- 「AI社員を育てる」ことに本気で取り組みたい
- OSS愛好家・カスタマイズ志向
✗ Hermes Agentの導入を見送るべき人
- ターミナル操作・Linux環境に強い拒否反応がある
- 「すぐに使える完成品」を求めている(Hermesは育てる前提)
- チーム全員でメッセージング経由のBotとして使いたい(OpenClawの方が適切)
- コードを直接書かせるのが主目的(Claude Codeの方が適切)
- API料金を一切払いたくない(モデル使用料は別途必要)
△ まず試してから判断すべき人(推奨)
- OpenClaw経験者で、次に何を試すか迷っている
- Claude Codeを使っていて、長期記憶の不足を感じている
- 個人開発者全般(2分でセットアップできるので試す価値あり)
よくある質問(FAQ)
~/.hermes/skills/.archive/に退避されるだけで、コマンド1つで復元可能です。さらにCurator実行前には毎回スキルディレクトリ全体のtar.gzスナップショットが取られ、ロールバック自体も再度ロールバックできます。手動でスキルファイルを編集・削除することももちろん可能です。まとめ:Hermes Agentは「育てるAIエージェント」の決定版
Hermes Agentは単なる「メモリ付きチャットボット」ではありません。固定された人格(SOUL.md)の上で、3層のメモリが時間を超えて文脈を保持し、エージェント自身が手順をスキルとして書き残し、Curatorが定期的に書庫を整理し、GEPAが「書庫の中身が本当に機能しているか」を実行ログから検証して進化させる──このループ全体を1つのOSSフレームワークに統合した世界で唯一のエージェントです。
- OpenClawとの違い:Hermesは「学習するエージェント」が主役、OpenClawは「メッセージングゲートウェイ」が主役。設計思想が真逆
- 3層メモリ:常時コンテキストのMarkdown / 全文検索SQLite / 外部プロバイダの組み合わせで容量と速度を両立
- 自己進化スキル:エージェントが自分で手順書を書き、Curatorが整理し、GEPAが進化させる
- 複数エージェント運用:Profile機能で1人〜10人のチーム編成が可能
- Claude Code連携:プログラマー役にClaude Maxを連携すれば、コーディング相棒として最強
- 自然言語cron:「毎朝8時にAIニュースをTelegramに送って」と言うだけで日次ダイジェストが自動配信される
普通のAIエージェントが「使うほどに同じことを繰り返させる対象」だとすれば、Hermesは「使うほどに自分の文脈と手順を蓄えていく相棒」です。AIエージェントを真剣に長期運用したいなら、Hermes Agentは現時点で最も投資する価値のあるOSSです。

