Hermes Agent完全解説｜OpenClawとの違い・3層メモリ・SOUL.md・GEPA最適化まで初心者からエンジニアまで徹底網羅【2026年5月最新】

2026年5月19日2026年7月11日

🔄 2026年7月時点の情報に更新

Hermes Agentとは？OpenClawとの違い・SOUL.md・自己進化スキルを徹底解説【2026年最新版】

Nous Researchが公開した「Hermes Agent」が、公開からわずかな期間でGitHubスター21万超を記録し、海外では「OpenClawだけ追っているのは機会損失」とまで言われ始めています。普通のAIエージェントが「セッションを閉じた瞬間に全部忘れる」のに対し、Hermes Agentは使うほど自分専用に賢くなり、自分でスキルを書き、自分で書き換える──そんな自己進化型エージェントです。本記事では、AIエージェント初心者でも理解できる比喩から始め、OpenClawとの設計思想の決定的な違い、3層メモリ・SOUL.md・GEPA最適化・複数エージェント運用まで、実装に踏み込んで徹底解説します。

この記事でわかること

Hermes Agentとは何か：たった3分で核心がわかる比喩での説明
OpenClawとの根本的な違い：「向き」が真逆である理由
普通のAIエージェントが抱える「セッション忘却問題」と、Hermesの解決アプローチ
SOUL.md（アイデンティティ層）・3層メモリ・自己進化スキル・Curator・GEPAの全構造
2分でセットアップする具体的手順とTelegram連携
1人から10人へ：プロファイルで複数エージェントを運用する方法
Claude Code連携でプログラマーエージェントを最強化する方法
自然言語で書ける組み込みcron：日次ダイジェスト自動配信の作り方
Nous Portal・サブスクリプション連携・セキュリティ機能など2026年の最新アップデート
Hermes Agent / OpenClaw / Claude Code の用途別使い分けフロー
導入すべき人 / 見送るべき人の判断基準

そもそもAIエージェントとは何か？普通のChatGPTとの違いを3分で

本題に入る前に、AIエージェントに不慣れな方のために前提を整理します。すでにOpenClawやClaude Codeを触っている方は、この章は読み飛ばしても構いません。

ChatGPT・Claudeなどの「チャットAI」との決定的な違い

ChatGPTやClaudeとの会話は、基本的に「あなたの質問に答える」ことに留まります。コードを書いてくれと頼めばコードを返してくれますが、そのコードをファイルに保存したり、テストを実行したり、Gitにコミットしたりは「あなたが」やります。

AIエージェントは違います。「テストが落ちているから直して」と頼むだけで、AIが自分でファイルを開き、コードを読み、修正し、テストを走らせ、結果を見て、必要なら再修正する──この一連の作業をAI自身が完結させます。

🎯 比喩で理解する

チャットAIは「賢い相談相手」。質問すれば的確に答えてくれるが、実際に動くのはあなた。
AIエージェントは「賢い部下」。「これやっといて」と頼めば、自分で考えて作業を完了させて報告してくれる。

普通のAIエージェントが抱えている深刻な問題

AIエージェントは確かに便利ですが、1つだけ致命的な弱点があります。

セッションが終わった瞬間に、全部忘れる

コーディングの好み、プロジェクトの規約、3回も指摘して直してもらったこと、昨日10分かけて見つけた修正方法──すべて消えます。次のセッションでは、またゼロからやり直しです。

たとえば「うちのプロジェクトでは関数はarrow functionで書いて、typeじゃなくinterfaceを使って」と毎回説明する必要がある。同じバグの直し方を3回も教えても、4回目にまた同じミスをしてくる。これがいまのAIエージェントの限界です。

Hermes Agentとは何か：「使うほど自分専用に賢くなる」エージェント

Hermes Agentは、米国のAI研究組織Nous Researchが2026年2月にオープンソース公開した、自己進化型のAIエージェントです。公開から急速にスターを伸ばし、2026年7月時点でGitHubスター21万超を記録、AIエージェント界隈で最も急成長しているプロジェクトの1つになっています。

213K+

GitHub Stars（2026年7月時点）

20+

対応メッセージングプラットフォーム

3層

永続メモリ構造

MIT

ライセンス（商用OK）

Hermes Agentの核心：3つの能力を1つに統合

Hermes Agentが他のエージェントと違うのは、普通なら別々に存在する3つの能力を1つのフレームワークに同居させたことです。

ランタイム時のスキル学習：エージェント自身が「うまくいったやり方」をスキルとして書き残し、次回以降に再利用する
3層構造の永続メモリ：セッションをまたいで「あなたのこと」と「プロジェクトのこと」を覚え続ける
GEPA最適化パイプライン：オフラインで実行ログを分析し、スキルを「進化」させる

公式の主張

「この3つすべてを載せたオープンソースエージェントは他にない」──Nous ResearchおよびAkshay Pachaar氏（LightningAI出身、BITS Pilani卒、3つの特許保有）の言葉。OpenClawでさえ、ここまでは揃えていません。

🎯 比喩で理解する

普通のAIエージェントは「毎日記憶が消える新人」。同じ説明を毎日繰り返す必要がある。
Hermes Agentは「あなたと一緒に成長する部下」。最初は教える必要があるが、教えたことを覚え、自分でメモを取り、自分のマニュアルを更新していく。1年後には「あなたの仕事の文脈を熟知した秘書」になっている。

OpenClawとの決定的な違い：「向き」が真逆である

「OpenClawとどう違うのか？」これが多くの読者が最も知りたい点でしょう。両者を比較すると、表面的には似ていますが、設計思想が真逆です。

1行で言うと

Kiloブログの的確な要約

「Hermesは”学習するエージェント“の周りにゲートウェイ（メッセージング窓口）を巻きつけた。OpenClawは”メッセージングゲートウェイ“の周りにエージェントを巻きつけた。」

Hermes Agent

主役：内部の学習ループ

発想：「自己進化するエージェントを作って、入口（Telegram等）を後付けする」

強み：スキル自動生成・3層メモリ・GEPA最適化など、エージェント自体の知性向上に特化

OpenClaw

主役：メッセージング統合

発想：「メッセージング体験を作って、そこにエージェントを差し込む」

強み：Slack・Discord等の主要チャットツールとの深い統合、チーム運用

機能比較表

項目	Hermes Agent	OpenClaw
提供元	Nous Research	OpenClaw Project
ライセンス	MIT	MIT
GitHub Star（2026年7月時点）	21万+	同等規模
スキル自己生成	○（核心機能）	×
永続メモリ	3層構造（MD+SQLite+外部）	あり（より単純）
アイデンティティ層	SOUL.md	—
オフライン最適化	GEPAパイプライン	×
メッセージング対応数	20+	主要チャットに深い統合
複数エージェント運用	Profile＋マルチエージェント基盤	あり
モデル切り替え	Claude / GPT / Gemini / Ollama / Nous Portal経由400+モデル	同等
セットアップ難易度	★★☆（ワンライナー、Windowsネイティブ対応）	★★☆
得意な用途	個人専用エージェント、長期運用、自己進化	チームでのメッセージング業務、社内Bot

使い分けの結論

両方使うのが正解という見方

HermesとOpenClawは競合ではなく、用途が異なります。個人の開発相棒はHermes、チームのメッセージング業務はOpenClawという棲み分けが現実的です。なお、OpenClawからの乗り換えはhermes setup実行時に~/.openclawが自動検出され、設定・メモリ・スキル・APIキーの移行まで案内されるため、移行コストは低めです。

Hermes Agentのアーキテクチャ全体像

ここから技術的な内部構造に踏み込みます。エンジニア向けの章ですが、初心者の方も比喩で追えるよう解説します。

全体構造はたった1つのクラスに集約されている

Hermesの全体は、run_agent.pyの中にある1つのAIAgentクラスを中心に動いています。CLI、メッセージング、バッチランナー、IDE連携──これらすべてが、同じコアエージェントの「入口」に過ぎません。だから「プラットフォーム非依存」が、実装としても成立しています。

┌─────────────────────────────────────────────┐
│ 入口（プラットフォーム非依存） │
│ CLI / Telegram / Discord / Slack / IDE │
│ (VS Code / Zed / JetBrains via ACP) │
└──────────────────┬──────────────────────────┘
↓
┌─────────────────────────────────────────────┐
│ AIAgent クラス（run_agent.py） │
│ ┌───────────────────────────────┐ │
│ │ ReAct系の同期ループ │ │
│ │ ① システムプロンプト構築 │ │
│ │ ② 圧縮チェック │ │
│ │ ③ API呼び出し（割り込み可能） │ │
│ │ ④ ツール呼び出し実行 │ │
│ │ ⑤ ループ │ │
│ └───────────────────────────────┘ │
└──────────────────┬──────────────────────────┘
↓
┌─────────────────────────────────────────────┐
│ 実行先（7種類から選択） │
│ Local / Docker / SSH / Modal / Daytona / │
│ Singularity / Vercel Sandbox │
└─────────────────────────────────────────────┘

後で効いてくる3つの細部

コマンド実行先を7種類から選べる

ローカルターミナル、Docker、SSH、Modal、Daytona、Singularity、Vercel Sandboxのいずれかを設定1つで切り替えられる。同じコードのまま、実行場所をノートPCからクラウドGPUサーバーに移すことが、コードを一切いじらずに可能です。

モデルの差し替えが自由

複数のAPIフォーマットに翻訳するレイヤーがあるため、Claude・GPT・Gemini・ローカルOllama、さらにNous Portal経由で400以上のモデルへの切り替えがコマンド1つで完結。何も壊れません。Anthropicが値上げしたらOpenAIに切り替える、なども簡単です。

タスクごとの90ターン上限

ループに陥ったエージェント（失敗するAPIをリトライし続ける、同じファイルを読み続けるなど）が、こっそりクレジットを焼き尽くす事故を防ぐためです。サブエージェントも同じ予算枠で動くため、委任の連鎖が暴走することもありません。

SOUL.md：アイデンティティ層──「Hermesは誰なのか」を決める

メモリやスキルの話に入る前に、その上に乗る層があります。「アイデンティティ」です。

なぜアイデンティティ層が必要か

メモリは「何を知っているか」、スキルは「どうやるか」を扱います。しかしこの2つだけでは、エージェントが現れたときに「誰なのか」がブレてしまう。同じエージェントが毎回違う帽子をかぶっているように見えてしまうわけです。

HermesはここをSOUL.mdという1つのファイルで解決しています。

🎯 比喩で理解する

SOUL.mdは「固定された額縁」、メモリとスキルは「その中で動く部品」。額縁が決まっていれば、中身が変わってもブレない人格を保てる。

SOUL.mdの動作

配置：~/.hermes/SOUL.md
読み込み：システムプロンプトの一番最初（スロット#1）、他のすべてが読み込まれる前
記述内容：性格・トーン・コミュニケーションスタイル・絶対やらないこと
性質：手書きで静的、一度書いて時々調整するだけ
フォールバック：ファイルがなければ組み込みのデフォルト人格を使用

プロジェクトが変わってもセッションが変わっても、性格は固定されたまま動きます。エージェントが書く記憶、生み出すスキル、知識整理の仕方──すべてがこのアイデンティティのレンズを通して行われるからです。

3層メモリシステム：3つの階層、3つの速度

Hermesには単一の「メモリ」がありません。3つの層に分かれていて、それぞれ目的と容量・速度が違います。

Tier 1：2つの小さなMarkdownファイル（常時コンテキスト）

TIER 1 – 高速・小容量

MEMORY.md（最大2,200文字）+ USER.md（最大1,375文字）

MEMORY.md：環境・プロジェクトの規約・ツールの癖・学んだ教訓など、エージェントが「自分のために書いたメモ」。

USER.md：あなた自身のプロフィール。名前、コミュニケーションの好み、習熟レベル、避けてほしいことなど。

動作：両方ともセッション開始時にシステムプロンプトに「固定スナップショット」として注入される。途中で新しいメモリが書き込まれてもディスクには即保存されるが、システムプロンプトに反映されるのは次のセッションから。

「80%圧縮」の仕組み

メモリがおおむね80%まで埋まると（システムプロンプトのヘッダーにパーセンテージで表示）、エージェントは「圧縮」を実行します。関連するエントリを統合し、より情報密度の高いバージョンに書き直す。結果として本当に有用な情報だけが残ります。

Tier 2：全会話の全文検索（オンデマンド）

TIER 2 – 中速・大容量

SQLite + FTS5による全文検索

CLIとメッセージング、両方の会話がすべてSQLiteに保存され、FTS5でフルテキスト検索できます。エージェントはここから何週間も前の会話を検索可能です。直近のアップデートでsession_searchが大幅に高速化・無料化されており、大量セッションを抱えても検索コストを気にせず使えるようになっています。

トレードオフ：Tier 1は常にコンテキストに入っているが容量小。Tier 2は容量無限だが、検索実行とLLMによる要約が必要。クリティカルな事実はTier 1、それ以外はTier 2をオンデマンド検索──これが棲み分けです。

Tier 3：外部メモリプロバイダ（8種類のプラグイン）

TIER 3 – 拡張・特化型

8種類のプラグイン可能な外部プロバイダ

さらに深い永続メモリのために、Hermesは8種類のプラグイン可能な外部プロバイダを同梱しています。組み込みメモリと「並走」する形で動き、置き換えるわけではありません。同時にアクティブにできるのは1つだけ。

いずれかの外部プロバイダがアクティブだと、Hermesは自動的に：

各ターン前に、関連メモリをプリフェッチ
各レスポンス後に、会話ターンをシンク
セッション終了時に、メモリを抽出

🎯 比喩で理解する

Tier 1＝デスクの上の付箋（毎回見るが場所がない）
Tier 2＝引き出しの中の書類（取り出す手間はあるが量を入れられる）
Tier 3＝外部倉庫（特化用途、必要に応じて契約）

自己進化するスキル：エージェント自身が書く手順書

メモリは「事実」を扱う層でした。スキルは「やり方」を扱う層です。これがHermes最大の特徴です。

スキルの構造

スキルはYAMLフロントマター付きのMarkdownファイルで、エージェントの「手続き的記憶」として機能します。何を知っているかではなく、どうやるかを記録します。

---
name: k8s-pod-debug
description: >
  Activate for crashing pods, CrashLoopBackOff,
  "why is my pod restarting", container failures.
version: 1.2.0
author: agent
platforms: [linux, macos]
---
## Procedure
1. Get pod status → check events → pull logs
2. Look for OOMed, ImagePullBackOff, config errors

## Pitfalls
- Forgetting --previous flag on restarted containers

## Verification
- Pod stays Running with 0 restarts for 5+ minutes

name、description、version、author、platformsがフロントマターに並び、本文に手順（Procedure）／落とし穴（Pitfalls）／検証（Verification）が並びます。エージェントが「自分のためのレシピ」を残す感覚です。

段階的開示（Progressive Disclosure）でトークン爆発を防ぐ

スキルが何百個になってもコンテキストを圧迫しない仕組みが「段階的開示」です。

レベル	読み込み内容	トークン消費
レベル0	名前と説明だけ	カタログ全体で約3,000トークン
レベル1	必要になったときにスキル本文をロード	そのスキル分のみ
レベル2	スキル内の特定の参照ファイルにさらに踏み込む	必要な参照分のみ

スキル作成のトリガー

エージェントはskill_manageツールを使って、自分でスキルを作ります。トリガーは次の場面です。

5回以上ツールを呼ぶような複雑なタスクを完了したとき
エラーやデッドエンドにぶつかった後、動く道筋を見つけたとき
ユーザーがアプローチを修正したとき
自明でないワークフローを発見したとき

ループはこう動きます：

スキル自己進化の核心ループ

問題に遭遇 → 試行錯誤して解く → うまくいったやり方をSKILL.mdとして保存 → 次に似た問題に出会ったらゼロから再発見せずに済む

skill_manageの6つのアクション

create：新規作成
patch：部分修正（トークン効率が良いので推奨）
edit：全書き換え
delete：削除
write_file：補助ファイル書き込み
remove_file：補助ファイル削除

Curator：スキル庫を勝手に片付けてくれる司書

何もしないと、エージェントが作ったスキルは際限なく積み重なります。狭くて重複した手順書が大量にでき、トークンを浪費し、カタログを汚していく。これを掃除するのが「Curator」です。

Curatorの起動条件

cronデーモンではなく、「非アクティブチェック」で起動します。最後の実行から7日経過 + エージェントが2時間以上アイドルのとき、エージェントのバックグラウンドフォークが立ち上がり、アクティブな会話には一切触らずに動きます。

2段階の動作

自動遷移（決定論的・LLM不要）

30日使われていないスキルはstaleに。90日使われていないスキルはarchiveに回されます。

LLMレビュー（最大8イテレーション）

フォークされたエージェントが、エージェント自身が作ったスキル群を眺めて、各スキルに「keep（残す）」「patch（修正）」「consolidate（統合）」「archive（保管）」のどれにするかを判断します。

絶対に壊さない2つの制約

Curatorが守る2つのルール

バンドル済みスキル・Hubからインストールされたスキルには絶対に触れない。エージェント自身が作ったものだけが対象
自動削除は一切しない。最悪のケースでも~/.hermes/skills/.archive/への退避にとどまり、コマンド1つで復元可能

さらに、Curatorが走る前には毎回スキルディレクトリ全体のtar.gzスナップショットを取ります。ロールバックはコマンド1つ。しかもロールバック自体も再度ロールバック可能です。

「このスキルだけは絶対消すな」というものがあれば、hermes curator pin <skill>でピン留めしておけば、アーカイブも削除もされません。パッチや編集は通るので、ピン留めしたまま改善は受けられます。

GEPA：実行ログから「実際に効くスキル」を進化させる

ここから一段深い話に入ります。エンジニア向けの章ですが、概念は重要なので追ってみてください。

なぜGEPAが必要か：エージェントの自己評価は甘い

エージェント内蔵の学習ループ（スキル作成＋Curator）には、よく知られた弱点があります。

エージェントは自己評価が甘い

実際には大したことがなくても「うまくやれた」と判定しがち。コミュニティのフィードバックでもこの傾向は確認されています。スキルを自動生成するのと同じ仕組みが、手動でカスタマイズした良いバージョンを、劣化したバージョンで上書きしてしまうこともあります。

ここで登場するのがGEPA（Genetic-Pareto Prompt Evolution）です。

GEPAの位置付け

Hermesランタイムには組み込まれていない（オフラインの最適化パイプライン）
別リポジトリ：NousResearch/hermes-agent-self-evolution
ICLR 2026のOral採択論文として発表、MITライセンスで公開

中心アイデア

エージェントに「うまくいったか？」と尋ねるのではなく、実行ログ（execution trace）を直接読んで「なぜ失敗したのか」を理解し、進化的探索でターゲットを絞った改良案を提案する。

パイプラインの流れ

現在のスキルを読み込む

Hermesリポジトリから対象スキルを取得

評価用データセットを作る

Claude Opusで合成テストケース、SQLiteから実セッション履歴（Claude Code・Copilot・Hermes自身の履歴も利用可能）、または手作りのゴールデンセット

GEPAオプティマイザを走らせる

実行ログを読む → 失敗箇所を理解する → 候補バリアントを生成

候補をLLM-as-judgeでスコアリング

バイナリ合否ではなくルブリック評価（複数観点での質的評価）

制約ゲートを通す

全テストスイートが100%通過、スキルは15KB以内、キャッシュ互換性を保つ、本来の意味的目的からズレない

最良のバリアントをPRとして送る

Hermesリポジトリへの「PR」として送る。直接コミットは絶対にしない。人間レビューを必ず挟む

GEPAのコストとメリット

GPUは要りません。すべてAPI呼び出しで完結。コストは1回の最適化につき$2〜$10。フルファインチューニング（RLやGRPO）に時間とお金を投じる前に試す価値があります。Akshay氏の関連解説によると、Berkeleyのチームが35倍少ないロールアウトでGPU学習なしにGRPOを10ポイント上回った事例も。

2026年の最新アップデート：Nous Portal・サブスク連携・セキュリティ強化

Hermes Agentは更新頻度が非常に高いプロジェクトです。初期リリースから数か月で、単体エージェントからマルチエージェント基盤へと大きく進化しています。ここでは特にインパクトの大きい最新機能を押さえておきます。

Nous Portal / Tool Gateway：1回のOAuthで全部つながる

hermes setup --portalを実行すると、Nousをプロバイダとして設定した上でTool Gatewayが有効化されます。これによりWeb検索・画像生成・TTS・ブラウザ操作の4ツールが、個別にAPIキーを取得しなくても1つのサブスクリプションでまとめて使えるようになります。もちろんツールごとに自分のAPIキーを持ち込むことも可能で、オールオアナッシングではありません。

既存のClaude Pro / ChatGPT Pro / SuperGrok契約をそのまま使える

API従量課金を避けられる大きなメリット

ローカルのサブスクリプションプロキシ機能により、Claude Pro・ChatGPT Pro・SuperGrokといったOAuthベースの既存契約をバックエンドとしてそのまま利用できます。すでにこれらのサブスクリプションを契約している人は、Hermes用に追加のAPI従量課金を払わずに済むケースがあります。

プロンプトインジェクション対策（Promptware / Brainworm防御）

近年報告されている「Brainworm」「Promptware Kill Chain」と呼ばれる攻撃手法を踏まえ、Hermesはツール出力・呼び出したメモリ・保存済みスキルを経由してエージェントを乗っ取ろうとする攻撃に対する防御機構を実装しています。悪意あるファイルや外部サービスがHermes自身のシステムメッセージになりすませないよう、ツール結果にデリミタマーカーを付与し、読み込み時に呼び出したメモリをパターンスキャンする、といった多層防御が組まれています。会社のコードや機密情報を扱う場合に安心材料となる機能です。

マルチエージェント基盤への進化

後述する「プロファイル」による複数エージェント運用に加えて、orchestrator（タスクの自動分解）・swarmトポロジー・タスクごとのgit worktree・タスクごとのモデル切り替えまで、単体エージェントの枠を超えたマルチエージェント運用基盤が急速に整備されています。個人利用のシンプルなProfile運用から、より本格的なチーム的運用まで、同じフレームワーク上でスケールできるようになっています。

認証情報を1つにまとめるBitwarden連携

~/.hermes/.envに各プロバイダのAPIキーを平文で置く代わりに、Bitwarden Secrets Managerと連携し1つのブートストラップトークンだけですべての認証情報を管理できるようになりました。複数エージェント・複数プロバイダを運用するほど、鍵管理の手間が効いてきます。

2分でセットアップする

ここから実際にHermes Agentを動かす手順に入ります。要件はシンプルです。

Linux・macOS・Windows（ネイティブ対応、WSL2は必須ではありません）
Python 3.11+（インストーラに同梱）
APIベースの利用なら8GB RAMで十分

ステップ1：ワンラインインストール

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
source ~/.bashrc   # zshなら ~/.zshrc

Windowsの場合はHermes Desktopインストーラをダウンロードして実行するか、CLIのみであれば同様のワンライナーを利用できます。インストーラがuv・Python 3.11・Node.js・ripgrep・ffmpeg・ポータブルGit Bashまで自動でセットアップするため、事前準備はほぼ不要です。

ステップ2：セットアップウィザード

hermes setup --portal

プロバイダ（Anthropic / OpenAI / OpenRouter / Nous Portal / Ollamaなど）、APIキー、モデル、ツールを順に聞いてくれます。--portalを付けると前述のTool Gatewayも同時に有効化されます。

ステップ3：ターミナルで会話開始

hermes

ステップ4：Telegramに接続（オプション）

@BotFatherに/newbotを送ってBotトークンを取得
@userinfobotで自分のTelegram User IDを取得
設定にそれぞれ入力

これでスマホからエージェントと話せる状態になります。

~/.hermes/ ディレクトリ構造

インストール直後、ホームディレクトリに新しいフォルダができます。レイアウトを把握しておくと、後の作業がすべて腹落ちします。

~/.hermes/
├── config.yaml           # メイン設定
├── .env                  # APIキー（Bitwarden連携で1トークン化も可）
├── auth.json             # OAuth認証情報
├── SOUL.md               # エージェントの人格（スロット#1）
│
├── memories/
│   ├── MEMORY.md         # エージェントが残す事実
│   └── USER.md           # ユーザーモデル
│
├── skills/               # 全スキル（同梱・Hub・自動生成）
│   ├── mlops/
│   ├── devops/
│   └── .hub/             # Skills Hubの状態
│
├── sessions/             # プラットフォーム別セッションメタデータ
├── state.db              # FTS5付きSQLiteセッションストア
├── cron/
│   ├── jobs.json         # スケジュールジョブ
│   └── output/           # cron実行出力
│
├── plugins/              # カスタムプラグイン
├── hooks/                # ライフサイクルフック
└── skins/                # CLIテーマ

Skills Hub：拡大を続けるスキルカタログを使う

Hermesは公式の「Skills Hub」を持っていて、開発初期は18カテゴリ・687個ほどの規模でしたが、コミュニティ拠出とsitemapベースのカタログ化によって登録スキル数は1万を大きく超える規模まで拡大しています。ゼロから自分で作る必要はありません。

カテゴリ	目安の個数	備考
組み込みスキル	約90個	デフォルトで利用可能
オプションスキル	約80個	ON/OFF切替可
Anthropic製	約16個	frontend-design、pdf、pptx、docx、mcp-builderなど
コミュニティ拠出（LobeHub等）	数百〜数千規模	幅広いコミュニティ貢献。sitemap経由の全体カタログは1万件超

任意のGitHubリポジトリを「タップ」として追加することもできます。

hermes skills tap add yourname/your-skills-repo
hermes skills install yourname/your-skills-repo/<skill-name>

これがチーム内でスキルを共有したり、自社用のプライベートコレクションを保守したりする方法です。なお、Skills Hubの仕様はagentskills.ioという公開標準に準拠しており、Hermes・Claude Code・Cursor・Codexなど複数のエージェント間でスキルを使い回せる設計になっています。

1人から10人へ：プロファイルで複数エージェントを運用する

エージェント1人運用でも便利ですが、Hermesが本当に面白くなるのは専門特化したエージェントを複数並走させたときです。

プロファイルとは

「プロファイル」がそのためのファーストクラス機能です。各プロファイルが完全に独立したHermesインスタンスで、自分専用のconfig、メモリ、スキル、セッション、SOUL.mdを持ちます。デフォルトでは互いに何も共有しません。

Profileの先にあるマルチエージェント基盤

基本のProfileは「独立したエージェントを複数持つ」機能ですが、その先にはorchestratorによるタスク自動分解やswarmトポロジーといった、より本格的なマルチエージェント運用の仕組みが用意されています。まずはProfileでシンプルに複数役割を運用し、必要に応じて自動タスク分解などの高度な機能に進む、という段階的な使い方がおすすめです。

3人チームの作成例

ここでは「デザイナー」「プログラマー」「リサーチャー」の3人チームを作ります。

# チーム作成（--cloneで初期configをコピー）
hermes profile create designer --clone
hermes profile create programmer --clone
hermes profile create researcher --clone

# 確認
hermes profile list

それぞれに専用Telegram Botを与える

Telegram Botは使い回せない

Telegramはトークン1つにつき1接続しか許さないため、Botを使い回すと壊れます。プロファイルごとに分ける必要があります。

BotFatherで/newbotを3回実行してトークンを3つ取り、プロファイルごとにゲートウェイセットアップを走らせます。

hermes -p designer gateway setup
hermes -p programmer gateway setup
hermes -p researcher gateway setup

SOUL.mdでそれぞれに人格を与える

ここでSOUL.mdが本領を発揮します。3人のエージェントを「中身は同じHermesなのに別人」にする層です。

例1：プログラマー `~/.hermes/profiles/programmer/SOUL.md`

# Soul
You are my staff engineer. Terse, direct, pragmatic.

You read code before you write code. You write the smallest change
that solves the problem. You prefer standard library over dependencies,
boring tech over shiny tech, and explicit over clever.

Always check: does this already exist in the codebase? Are there
tests? What breaks if this fails? Run the tests before saying "done."

意訳：「私のスタッフエンジニア。簡潔、直接、実務的。書く前に読む。問題を解く最小限の変更を書く。標準ライブラリを依存に優先し、地味な技術を派手な技術に優先し、明示的を”賢い”より優先する。常に確認しろ：コードベースに既に存在しないか？テストはあるか？失敗したら何が壊れるか？”done”と言う前にテストを走らせろ」

例2：リサーチャー `~/.hermes/profiles/researcher/SOUL.md`

# Soul
You are my deep researcher for the AI and machine learning space.
Your main job is a daily Telegram digest of what's new and what
matters.

Cover four streams: trending GitHub repos, big tech and lab
announcements, fresh research papers, and the social pulse on X,
Reddit, and Hacker News. Lead with what changed since yesterday.
Cite every claim with a URL. Flag when signal is thin.

Use delegate_task aggressively to parallelize across streams. Never
state a contested claim as settled. Never fabricate a citation.

意訳：「AI・機械学習領域の深掘り担当。主な仕事は毎日のTelegramダイジェスト。4ストリームをカバー：GitHubトレンド／大手テック・ラボの発表／新しい論文／X・Reddit・HNの社会的反応。昨日からの変化を最初に提示する。全主張にURLで出典をつける。シグナルが薄いときはそう明示する。delegate_taskを積極的に使ってストリームを並列処理する。争点のある主張を確定事項として書くな。出典を捏造するな」

プログラマーをClaude Code連携で最強化する

プログラマー役は、「自分でコードを書く」のではなく「Claude Code CLIに実行を委任する」設計にすると本当に強くなります。Hermesはオーケストレーション（指揮）に徹し、Claude Codeがファイル編集・コマンド実行・git管理を担当します。

🎯 比喩で理解する

Hermesが「プロジェクトマネージャー」、Claude Codeが「実装エンジニア」。Hermesは何をすべきか判断し、Claude Codeに指示を出す。実装の細部はClaude Codeが担当し、結果をHermesが受け取って次の手を判断する。

セットアップは1メッセージで完了

セッションを開いて、この1通のアクティベーションプロンプトを送るだけです。

I already have a Claude Max subscription. You are my staff engineer who
helps me with my day-to-day coding tasks, and under the hood you use
Claude Code for all the executions. Set yourself up accordingly.

これでプログラマーは自動的にautonomous-ai-agents/claude-codeスキルをインストールし、claudeバイナリがPATHにあることを確認したうえで、それを実行に使い始めます。次のメッセージから、ファイル読み込み・コード書き込み・テスト実行・コミット・プッシュなど「コード関連のすべて」が、裏ではClaude Code経由で動くようになります。

事前確認しておくべき2点

アクティベート前にclaudeがPATHに通っていること。which claudeで実バイナリのパスが返ればOK
Claude Codeには「printモード（ワンショット、高速、TUIなし）」と「インタラクティブモード（フルtmuxセッション）」があり、プログラマーがタスクに応じて自動で選び分ける。考えなくて良い

LIF TechではGemini CLIの使い方やDeepSeek V4 ProのClaude Code連携でも、コーディング系AIエージェントの実務的な使い方を解説しています。あわせて参照ください。

デザイナーをカスタマイズ：自分のビジュアル様式を学ばせる

デザイナーが本当に役立ち始めるのは、汎用的なAI画像ではなく「あなたのスタイル」で生成できるようになったときです。

パターン：リファレンスを見せて、スキルを自分で書かせる

手作業でスキルを書く代わりに、良い例を見せて、パターンをエージェント自身にコード化させる──これが自己改善ループを「セットアップ手段」として使う面白いところです。

デザイナーのセッションを開いて、参照画像をドラッグ＆ドロップ（TelegramならBotに添付）し、このプロンプトを送ります。

Carefully study these reference illustrations. Note the color palette,
line weight, level of detail, composition, and overall aesthetic.

I want you to create a new skill called "my-design-style" that captures
this visual style. The skill should:

1. Document the style fingerprint in plain language (palette, line
   weights, composition rules, recurring motifs)
2. Include a Python script that takes a text description of a new
   illustration and generates the image using the Nano Banana model
   (google/gemini-2.5-flash-image) via the OpenRouter API in this style
3. Read OPENROUTER_API_KEY from the environment

Use skill_manage to create it. Test the generated script on a sample
prompt before saying it's done.

デザイナーは参照を分析し、SKILL.mdを書き、Pythonスクリプトを生成し、~/.hermes/profiles/designer/skills/my-design-style/に保存し、サンプルプロンプトでスクリプトを実行して動作確認するところまで自走します。

画像以外への応用

このパターンは画像だけのものではありません。リファレンスを与え、エージェントに「これと同じパターンを再現するスキル」を作らせる──ニュースレターの導入文、Xスレッド、コードレビューコメントなど、一貫性が欲しいあらゆる出力に応用できます。

仕事をスケジュールする：自然言語で書ける組み込みcron

リサーチャーに「毎日のTelegramダイジェスト」を出させるには、スケジュール実行が必要です。Hermesにはそのための組み込みスケジューラがあります。

動作の仕組み

ゲートウェイデーモンが60秒ごとにチェック
期限に達したジョブを独立したエージェントセッションで実行
指定したメッセージングプラットフォームに結果を届ける
ジョブは再起動を超えて生き残る（~/.hermes/cron/jobs.jsonに保存）
出力は~/.hermes/cron/output/に残る
REST API経由でcronジョブを管理することも可能（外部システムとの連携に便利）

cron式を書く必要がない

面白いのは、cron式を書かなくていいことです。やってほしいことを自然言語（英語または日本語）で記述すれば、Hermesがcron式に変換してくれます。

リサーチャーの日次ダイジェスト設定例

リサーチャーとのセッションを開いて、このプロンプトを送るだけです。

Every weekday at 8am India time, prepare a deep digest of what's new
in the AI and machine learning space over the last 24 hours. Cover
four streams in this order:

1. Trending GitHub repos (especially new AI/ML tooling)
2. Big tech and lab announcements (Anthropic, OpenAI, Google, Meta,
   xAI, Nous, etc.)
3. Fresh research papers worth reading
4. Social pulse from X, Reddit, and Hacker News

Lead with what changed since yesterday. Cite every claim with a URL.
Keep it under 800 words. Deliver to Telegram.

Set this up as a recurring cron job.

リサーチャーは自身のcronjobツールでジョブを作成し、配信先を現在のチャット（このケースではTelegram）にデフォルト設定し、あとはスケジューラに任せます。

確認は1コマンド：

hermes -p researcher cron list

登録ジョブと次回実行時刻が表示されます。翌朝8時、Telegramが光ってダイジェストが届きます。ここから先、あなたは何もしなくて良い。

cronのその他の便利パターン

パターン	コマンド例	用途
ワンショット遅延	`/cron add 30m "Check the build"`	30分後に1回だけ走る
定期インターバル	`/cron add "every 2h" "Check server"`	2時間ごと
標準cron式	`/cron add "0 9 * * 1-5" "..."`	平日9時など正確な制御
スキル添付	`/cron add "every 1h" "Summarize" --skill blogwatcher`	実行前にスキルをロード

さらにcontext_fromフラグを使えば、あるcronの出力を次のcronの入力にチェーンすることもできます。「リサーチフェーズの結果をライティングフェーズの入力にする」といった多段階自動化に重宝します。

Hermes Agent vs Claude Code vs OpenClaw 用途別使い分け

3つのツールを並べて、どれを選ぶべきかを整理します。

機能・特徴の比較

項目	Hermes Agent	Claude Code	OpenClaw
提供元	Nous Research	Anthropic	OSS
提供形態	CLI + メッセージング + IDE	CLI主体	メッセージング主体
自己進化スキル	○（核心機能）	△（限定的）	×
3層メモリ	○	△（簡易）	○（単純）
SOUL.md相当	○	CLAUDE.md	—
モデル切り替え	Claude/GPT/Gemini/Ollama/Nous Portal	Claude固定	同等
コーディング能力	△（Claude Code連携で強化）	◎	△
メッセージング統合	20+	△	深い統合
セットアップ難易度	★★☆	★☆☆	★★☆
料金	API従量または既存サブスク連携	Claude Max契約	API従量

判断フロー

Q1：そもそも「コードを書かせる」のがメインか？

→ Yes → Claude Codeを中心に据える（必要に応じてHermesでオーケストレーション）

→ No → Q2へ

Q2：「自分専用に進化する個人秘書」が欲しいか？

→ Yes → Hermes Agentを選ぶ

→ No → Q3へ

Q3：「チームでSlack/Discord経由で使う」のがメインか？

→ Yes → OpenClawを選ぶ

→ No → Q4へ

Q4：複数の役割を1人で運用したい（個人開発・1人会社）？

→ Yes → Hermes AgentのProfile機能でデザイナー・プログラマー・リサーチャーを並走

→ No → 用途が明確でないなら、まずClaude Codeから始める

Hermes Agentを導入すべき人 / 見送るべき人

✗ Hermes Agentの導入を見送るべき人

ターミナル操作に強い拒否反応がある
「すぐに使える完成品」を求めている（Hermesは育てる前提）
チーム全員でメッセージング経由のBotとして使いたい（OpenClawの方が適切）
コードを直接書かせるのが主目的（Claude Codeの方が適切）
API料金を一切払いたくない（Nous Portalや既存サブスク連携でコストは抑えられるが、モデル使用料自体はどこかで発生する）

△ まず試してから判断すべき人（推奨）

OpenClaw経験者で、次に何を試すか迷っている
Claude Codeを使っていて、長期記憶の不足を感じている
個人開発者全般（2分でセットアップできるので試す価値あり）

よくある質問（FAQ）

Hermes AgentはOpenClawの代替になりますか？

用途が異なるため、完全な代替ではありません。Hermesは「自己進化する個人エージェント」、OpenClawは「チームでのメッセージング統合」が強みです。個人開発者にはHermes、チーム業務にはOpenClawが向いています。両方使うのも現実的な選択で、OpenClawからの乗り換えは設定・メモリ・スキル・APIキーの自動移行にも対応しています。

Hermes Agentは無料で使えますか？

Hermes AgentそのものはMITライセンスのOSSで完全無料です。バックエンドのLLM API（Claude、GPT、Gemini等）は別途利用料が発生しますが、既にClaude Pro・ChatGPT Pro・SuperGrokを契約している場合は、そのサブスクリプションをバックエンドとしてそのまま使う選択肢もあります。Ollamaなどローカルモデルを使えば完全無料での運用も可能です。

日本語のドキュメントはありますか？

公式の日本語ドキュメントが提供されています。Hermes Agent公式日本語ページで基本機能を確認できます。詳細なAPIリファレンスや内部実装は英語ドキュメントが中心です。

Windows環境でも動きますか？

動きます。以前はWSL2が推奨でしたが、現在はネイティブWindows対応となり、CLI・ゲートウェイ・TUI・各種ツールがWSL2なしで動作します。もちろんWSL2環境で使いたい場合は、Linux/macOS向けのワンライナーをそのままWSL2内で実行することも可能です。

Claude Codeと併用する場合、料金はどうなりますか？

Hermes Agent本体は無料、Claude Codeの実行はClaude Maxサブスクリプションで賄えます。Hermes側でClaude APIを直接呼び出す部分は、選択したモデルのAPI料金が別途発生します。Claude Maxを既に契約している人は追加コストなしでClaude Code連携を享受できるのがメリットです。

セキュリティは大丈夫ですか？会社のコードを扱っても安全？

実行先をローカルターミナル・Docker・SSH・Modal・Daytona・Singularity・Vercel Sandboxから選択可能です。加えて、ツール出力・呼び出したメモリ・保存済みスキルを経由したエージェント乗っ取り（プロンプトインジェクション）を防ぐ専用の防御機構も実装されています。コードがクラウドに送信されるのはバックエンドLLM API呼び出し時のみで、その範囲は通常のLLM APIと同じです。機密性の高いコードを扱う場合は、Ollama等のローカルLLMをバックエンドに選ぶことで完全オンプレ運用も可能です。

GEPAは必須ですか？

必須ではありません。最初は飛ばして良いステップです。スキル作成とCuratorだけで十分機能します。GEPAが必要になるのは、特定のスキルの品質に壁を感じたとき。フルファインチューニング（RL・GRPO）に時間とお金を投じる前の選択肢として位置付けられます。

SOUL.mdを書かないとどうなりますか？

組み込みのデフォルト人格にフォールバックします。動作には問題ありませんが、「自分専用に育てる」というHermesの本領を発揮させるなら、SOUL.mdは最初に書いておくことを強く推奨します。10分の作業で、その後のセッションの質が大きく変わります。

スキルが増えすぎてコンテキストを圧迫しませんか？

「段階的開示（Progressive Disclosure）」の仕組みで防がれています。レベル0では名前と説明のみ（カタログ全体で約3,000トークン）、必要になったときに本文をロード、さらに必要なら参照ファイルに踏み込む──という階層化により、Skills Hub全体が1万件超の規模になってもコンテキスト爆発しません。

エージェントが間違ったスキルを作ってしまったら？

Curatorが30日・90日のタイマーで自動整理しますが、自動削除は一切行いません。最悪でも~/.hermes/skills/.archive/に退避されるだけで、コマンド1つで復元可能です。さらにCurator実行前には毎回スキルディレクトリ全体のtar.gzスナップショットが取られ、ロールバック自体も再度ロールバックできます。手動でスキルファイルを編集・削除することももちろん可能です。

複数エージェント運用すると料金は人数倍になりますか？

はい、各プロファイルが独立したLLM呼び出しを行うため、使った分だけAPI料金が発生します。ただし全プロファイルが常時稼働するわけではなく、メッセージを受け取ったときや定期cronジョブの実行時のみ動きます。コストを抑えるなら、リサーチャーには安価なモデル（GPT-4o-miniやHaiku）、プログラマーには高性能モデル（Opus）と使い分けるのが効果的です。

まとめ：Hermes Agentは「育てるAIエージェント」の決定版

Hermes Agentは単なる「メモリ付きチャットボット」ではありません。固定された人格（SOUL.md）の上で、3層のメモリが時間を超えて文脈を保持し、エージェント自身が手順をスキルとして書き残し、Curatorが定期的に書庫を整理し、GEPAが「書庫の中身が本当に機能しているか」を実行ログから検証して進化させる──このループ全体を1つのOSSフレームワークに統合した世界で唯一のエージェントです。2026年に入ってからはNous Portal・サブスク連携・セキュリティ強化・マルチエージェント基盤と、進化のスピードもさらに加速しています。

OpenClawとの違い：Hermesは「学習するエージェント」が主役、OpenClawは「メッセージングゲートウェイ」が主役。設計思想が真逆
3層メモリ：常時コンテキストのMarkdown / 全文検索SQLite / 外部プロバイダの組み合わせで容量と速度を両立
自己進化スキル：エージェントが自分で手順書を書き、Curatorが整理し、GEPAが進化させる
複数エージェント運用：Profile機能で1人〜10人のチーム編成が可能、その先にはorchestratorやswarmトポロジーも
Claude Code連携：プログラマー役にClaude Maxを連携すれば、コーディング相棒として最強
自然言語cron：「毎朝8時にAIニュースをTelegramに送って」と言うだけで日次ダイジェストが自動配信される
2026年の新機能：Nous Portal・既存サブスク連携・プロンプトインジェクション対策で実務利用のハードルがさらに下がった

普通のAIエージェントが「使うほどに同じことを繰り返させる対象」だとすれば、Hermesは「使うほどに自分の文脈と手順を蓄えていく相棒」です。AIエージェントを真剣に長期運用したいなら、Hermes Agentは現時点で最も投資する価値のあるOSSです。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

Hermes Agent完全解説｜OpenClawとの違い・3層メモリ・SOUL.md・GEPA最適化まで初心者からエンジニアまで徹底網羅【2026年5月最新】

Hermes Agentとは？OpenClawとの違い・SOUL.md・自己進化スキルを徹底解説【2026年最新版】

そもそもAIエージェントとは何か？普通のChatGPTとの違いを3分で

ChatGPT・Claudeなどの「チャットAI」との決定的な違い

普通のAIエージェントが抱えている深刻な問題

Hermes Agentとは何か：「使うほど自分専用に賢くなる」エージェント

Hermes Agentの核心：3つの能力を1つに統合

OpenClawとの決定的な違い：「向き」が真逆である

1行で言うと

Hermes Agent

OpenClaw

機能比較表

使い分けの結論

✓ Hermes Agentを選ぶべき人

✓ OpenClawを選ぶべき人

Hermes Agentのアーキテクチャ全体像

全体構造はたった1つのクラスに集約されている

後で効いてくる3つの細部

SOUL.md：アイデンティティ層──「Hermesは誰なのか」を決める

なぜアイデンティティ層が必要か

SOUL.mdの動作

3層メモリシステム：3つの階層、3つの速度

Tier 1：2つの小さなMarkdownファイル（常時コンテキスト）

MEMORY.md（最大2,200文字）+ USER.md（最大1,375文字）

Tier 2：全会話の全文検索（オンデマンド）

SQLite + FTS5による全文検索

Tier 3：外部メモリプロバイダ（8種類のプラグイン）

8種類のプラグイン可能な外部プロバイダ

自己進化するスキル：エージェント自身が書く手順書

スキルの構造

段階的開示（Progressive Disclosure）でトークン爆発を防ぐ

スキル作成のトリガー

skill_manageの6つのアクション

Curator：スキル庫を勝手に片付けてくれる司書

Curatorの起動条件

2段階の動作

絶対に壊さない2つの制約

GEPA：実行ログから「実際に効くスキル」を進化させる

なぜGEPAが必要か：エージェントの自己評価は甘い

GEPAの位置付け

中心アイデア

パイプラインの流れ

2026年の最新アップデート：Nous Portal・サブスク連携・セキュリティ強化

Nous Portal / Tool Gateway：1回のOAuthで全部つながる

既存のClaude Pro / ChatGPT Pro / SuperGrok契約をそのまま使える

プロンプトインジェクション対策（Promptware / Brainworm防御）

マルチエージェント基盤への進化

認証情報を1つにまとめるBitwarden連携

2分でセットアップする

ステップ1：ワンラインインストール

ステップ2：セットアップウィザード

ステップ3：ターミナルで会話開始

ステップ4：Telegramに接続（オプション）

~/.hermes/ ディレクトリ構造

Skills Hub：拡大を続けるスキルカタログを使う

1人から10人へ：プロファイルで複数エージェントを運用する

プロファイルとは

3人チームの作成例

それぞれに専用Telegram Botを与える

SOUL.mdでそれぞれに人格を与える

例1：プログラマー ~/.hermes/profiles/programmer/SOUL.md

例2：リサーチャー ~/.hermes/profiles/researcher/SOUL.md

プログラマーをClaude Code連携で最強化する

セットアップは1メッセージで完了

デザイナーをカスタマイズ：自分のビジュアル様式を学ばせる

パターン：リファレンスを見せて、スキルを自分で書かせる

仕事をスケジュールする：自然言語で書ける組み込みcron

動作の仕組み

cron式を書く必要がない

リサーチャーの日次ダイジェスト設定例

cronのその他の便利パターン

Hermes Agent vs Claude Code vs OpenClaw 用途別使い分け

機能・特徴の比較

判断フロー

Q1：そもそも「コードを書かせる」のがメインか？

Q2：「自分専用に進化する個人秘書」が欲しいか？

Q3：「チームでSlack/Discord経由で使う」のがメインか？

Q4：複数の役割を1人で運用したい（個人開発・1人会社）？

Hermes Agentを導入すべき人 / 見送るべき人

✓ Hermes Agentを即導入すべき人

例1：プログラマー `~/.hermes/profiles/programmer/SOUL.md`

例2：リサーチャー `~/.hermes/profiles/researcher/SOUL.md`