AIがブン回る環境づくり! 第4部:エージェントハーネス

連載「AIがブン回る環境づくり!」第4部。SSoTと開発ワークフローを、入口、Skills、役割分担、Commands、自走ループへ変換し、AIエージェントがタスクからPRまで同じ型で進められる実行基盤を整理します。

連載 AIがブン回る環境づくり! 第4部 エージェントハーネス

連載「AIがブン回る環境づくり!」第4部です。第2部のSSoTと第3部の開発ワークフローを、AIが毎回たどれる実行基盤へ変えます。

私たちは、AI駆動開発を安定させる鍵は、手順を文書で終わらせず、AIが実行できるハーネスに変えることだと考えています。

SSoTがあり、開発ワークフローがあっても、AIエージェントが毎回それを探し、読み、解釈する状態では安定しません。タスク開始、調査、計画、実装、検証、レビュー、PR作成までを、再利用できる流れにする必要があります。

エージェントハーネスは、そのための実行基盤です。入口、Skills、役割分担、Commands、自走ループをつなぎ、AIが同じ型で作業できる状態を作ります。

第4部では、AIが作業を始める入口からPRまでを一つの流れとして扱います。最後の第5部では、このハーネスへどのタスクを流し込むかを決める、センシングとループエンジニアリングへ進みます。

ハーネスは、文書をAIの実行単位へ変える

ハーネスは、SSoTとワークフローをAIの実行単位へ変換します。

入口には、最初に読むべき地図を置きます。ここには詳細手順を詰め込まず、作業領域、依存方向、品質ゲート、禁止操作、詳細ルールの場所を短く示します。

Skillsには、繰り返す作業の手順を置きます。調査して計画を書く、品質ゲートを順番に走らせる、CI失敗を再現する、PR説明文を決まった形式で作る。こうした作業を毎回チャットで説明しているなら、Skill化の候補です。

役割分担も重要です。調査担当、実装担当、テスト担当、レビュー担当を分けると、権限と視点を分けられます。読み取りだけでよい役割に書き込み権限を渡す必要はありません。実装した本人とは別の視点でレビューすることもできます。

Commandsは、手順を呼び出す薄い入口です。「PR前チェックをする」「CI失敗を直す」「UIレビューをする」のような短い呼び出しから、対応するSkillへつなげます。

入口、Skills、Agents、Commands、自走ループの構造図

Skillsは、作業手順を個人の記憶から外に出す

Skillsの価値は、作業の速さだけではありません。同じ種類の作業で、同じ品質バーを使えることにあります。

たとえば、Tech Blogを書く、CI失敗を調べる、PRレビューを行う、公開前マーケティングゲートを通す。これらは毎回ゼロから説明するより、入力、参照する正典、手順、完了条件をSkillとして持つ方が安定します。

Skillがあると、AIは「何を読むか」「どの順で進めるか」「どこまでやれば完了か」をたどれます。人間も、AIに渡した作業がどの基準で進むのかを見通しやすくなります。

ここで重要なのは、Skillを大きくしすぎないことです。1つのSkillに調査、実装、レビュー、公開判断を全部詰めると、使う場面がぼやけます。繰り返す作業単位ごとに小さく切り出す方が、AIにも人間にも扱いやすくなります。

役割分担は、権限と視点を分ける

AIエージェントを1人の万能担当として扱うと、調査、実装、検証、レビューが同じ視点に寄ります。

役割を分けると、作業の中に自然なチェックポイントができます。調査担当は読み取り中心でよいかもしれません。実装担当はファイル編集とテスト実行が必要です。レビュー担当は差分を読み、設計、セキュリティ、法務、ブランドの観点から疑う役割に徹します。

この分け方は、権限設計にも効きます。読み取りだけでよい役割に、書き込み権限を渡す必要はありません。外部サービスに触る役割、ローカルだけで完結する役割、公開判断をする役割を分けると、安全に任せられる範囲が見えます。

AIの自走は、何でも一つに任せることではありません。役割ごとに期待値と権限を分け、必要なところで視点を切り替えることです。

自走ループは、タスクからPRまでを閉じる

ハーネスの中心に置くのは、自走ループです。

典型的には、Preflight、Planning、Implementation、QA、Review、PRの6フェーズで考えます。タスクを読み、作業領域を確保し、受け入れ条件と検証方法を決めます。その後、最小差分で実装し、品質ゲートを通し、必要に応じて別視点でレビューし、最後にPRとして要約と証跡を渡します。

自走ループの価値は、AIを放置することではありません。人間が介入すべき場所を前に決めることです。計画で見るのか、レビューで見るのか、ゲート失敗時に止めるのか。介入点が決まっていれば、人間はAIの全行動を監視しなくて済みます。

このとき、完了条件は「作業した」ではなく「ゲートを通し、残リスクを説明できる」まで置きます。AIがPRを作る場合も、何を変えたか、どう確認したか、どこに不確実性が残るかをセットで渡します。

PreflightからPRまでの自走ループ

ハーネスだけでは、依頼待ちは残る

エージェントハーネスを整えると、AIは同じ型でタスクを進められるようになります。

ただし、ハーネスだけでは、AIは人間から渡されたタスクを待ちます。次に必要になるのは、エラー、バグチケット、顧客要望、性能劣化、利用データのような信号を拾い、AIが扱える作業単位へ変換することです。

第5部では、このセンシングとループエンジニアリングを扱います。AIに依頼する作業を増やすのではなく、期待値との差を見つけ、ハーネスへ流し込み、改善を回し続ける構造を見ます。

連載ナビ

  1. 第1部:AI駆動開発の全体像
  2. 第2部:SSoTとガバナンス
  3. 第3部:開発ワークフロー
  4. 第4部:エージェントハーネス(この記事)
  5. 第5部:ループエンジニアリング

関連サービス

  • テクニカルディレクション: Skills、Commands、役割分担、レビュー、品質ゲートを含めたコーディングエージェント運用設計を支援します。
  • AI Agent開発: 業務で使うAI Agentを、期待値、証拠、人間の確認ポイントまで含めて設計します。

参考にした一次情報

エージェントハーネスの設計を相談する