連載「AIがブン回る環境づくり!」第4部です。第2部のSSoTと第3部の開発ワークフローを、AIが毎回たどれる実行基盤へ変えます。
私たちは、AI駆動開発を安定させる鍵は、手順を文書で終わらせず、AIが実行できるハーネスに変えることだと考えています。
SSoTがあり、開発ワークフローがあっても、AIエージェントが毎回それを探し、読み、解釈する状態では安定しません。タスク開始、調査、計画、実装、検証、レビュー、PR作成までを、再利用できる流れにする必要があります。
エージェントハーネスは、そのための実行基盤です。入口、Skills、役割分担、Commands、自走ループをつなぎ、AIが同じ型で作業できる状態を作ります。
第4部では、AIが作業を始める入口からPRまでを一つの流れとして扱います。最後の第5部では、このハーネスへどのタスクを流し込むかを決める、センシングとループエンジニアリングへ進みます。
ハーネスは、文書をAIの実行単位へ変える
ハーネスは、SSoTとワークフローをAIの実行単位へ変換します。
入口には、最初に読むべき地図を置きます。ここには詳細手順を詰め込まず、作業領域、依存方向、品質ゲート、禁止操作、詳細ルールの場所を短く示します。
Skillsには、繰り返す作業の手順を置きます。調査して計画を書く、品質ゲートを順番に走らせる、CI失敗を再現する、PR説明文を決まった形式で作る。こうした作業を毎回チャットで説明しているなら、Skill化の候補です。
役割分担も重要です。調査担当、実装担当、テスト担当、レビュー担当を分けると、権限と視点を分けられます。読み取りだけでよい役割に書き込み権限を渡す必要はありません。実装した本人とは別の視点でレビューすることもできます。
Commandsは、手順を呼び出す薄い入口です。「PR前チェックをする」「CI失敗を直す」「UIレビューをする」のような短い呼び出しから、対応するSkillへつなげます。

Skillsは、作業手順を個人の記憶から外に出す
Skillsの価値は、作業の速さだけではありません。同じ種類の作業で、同じ品質バーを使えることにあります。
たとえば、Tech Blogを書く、CI失敗を調べる、PRレビューを行う、公開前マーケティングゲートを通す。これらは毎回ゼロから説明するより、入力、参照する正典、手順、完了条件をSkillとして持つ方が安定します。
Skillがあると、AIは「何を読むか」「どの順で進めるか」「どこまでやれば完了か」をたどれます。人間も、AIに渡した作業がどの基準で進むのかを見通しやすくなります。
ここで重要なのは、Skillを大きくしすぎないことです。1つのSkillに調査、実装、レビュー、公開判断を全部詰めると、使う場面がぼやけます。繰り返す作業単位ごとに小さく切り出す方が、AIにも人間にも扱いやすくなります。
役割分担は、権限と視点を分ける
AIエージェントを1人の万能担当として扱うと、調査、実装、検証、レビューが同じ視点に寄ります。
役割を分けると、作業の中に自然なチェックポイントができます。調査担当は読み取り中心でよいかもしれません。実装担当はファイル編集とテスト実行が必要です。レビュー担当は差分を読み、設計、セキュリティ、法務、ブランドの観点から疑う役割に徹します。
この分け方は、権限設計にも効きます。読み取りだけでよい役割に、書き込み権限を渡す必要はありません。外部サービスに触る役割、ローカルだけで完結する役割、公開判断をする役割を分けると、安全に任せられる範囲が見えます。
AIの自走は、何でも一つに任せることではありません。役割ごとに期待値と権限を分け、必要なところで視点を切り替えることです。
自走ループは、タスクからPRまでを閉じる
ハーネスの中心に置くのは、自走ループです。
典型的には、Preflight、Planning、Implementation、QA、Review、PRの6フェーズで考えます。タスクを読み、作業領域を確保し、受け入れ条件と検証方法を決めます。その後、最小差分で実装し、品質ゲートを通し、必要に応じて別視点でレビューし、最後にPRとして要約と証跡を渡します。
自走ループの価値は、AIを放置することではありません。人間が介入すべき場所を前に決めることです。計画で見るのか、レビューで見るのか、ゲート失敗時に止めるのか。介入点が決まっていれば、人間はAIの全行動を監視しなくて済みます。
このとき、完了条件は「作業した」ではなく「ゲートを通し、残リスクを説明できる」まで置きます。AIがPRを作る場合も、何を変えたか、どう確認したか、どこに不確実性が残るかをセットで渡します。

ハーネスだけでは、依頼待ちは残る
エージェントハーネスを整えると、AIは同じ型でタスクを進められるようになります。
ただし、ハーネスだけでは、AIは人間から渡されたタスクを待ちます。次に必要になるのは、エラー、バグチケット、顧客要望、性能劣化、利用データのような信号を拾い、AIが扱える作業単位へ変換することです。
第5部では、このセンシングとループエンジニアリングを扱います。AIに依頼する作業を増やすのではなく、期待値との差を見つけ、ハーネスへ流し込み、改善を回し続ける構造を見ます。
連載ナビ
- 第1部:AI駆動開発の全体像
- 第2部:SSoTとガバナンス
- 第3部:開発ワークフロー
- 第4部:エージェントハーネス(この記事)
- 第5部:ループエンジニアリング
関連サービス
- テクニカルディレクション: Skills、Commands、役割分担、レビュー、品質ゲートを含めたコーディングエージェント運用設計を支援します。
- AI Agent開発: 業務で使うAI Agentを、期待値、証拠、人間の確認ポイントまで含めて設計します。