第一巻の振り返り:閉ループから進化へ
3つの章を通して、Agent開発と従来の開発の構造的な違いは、漠然とした症状の集まりから、診断可能な問題へと変わったはずです。意図の喪失はもはや「Agentの能力不足」ではなく、contextに明示的なspecが欠けていることです。検証の失敗はもはや「テストの書き方が悪い」ではなく、検証のアンカーがコードに向いていて規約に向いていないことです。体系の腐敗はもはや「ドキュメントを誰もメンテナンスしない」ではなく、ドキュメントの進化をエンジニアリングアクションに変えるプロセスが欠けていることです。
さらに重要なのは、これら3つの問題すべてに具体的な操作方法が確立されたことです。意図からspecへの構造化手法、specをアンカーとする検証体系、changeパッケージでドキュメントの進化を管理するプロセスが揃いました。これらは理論的なフレームワークではありません。OKRの事例では、一文の要件から出発して26/28項目のコンプライアンスチェックに合格し、さらに最初のfeatureの成功から2番目のfeatureへのdelta統合まで到達しました。
第一巻はharnessの完全な定義を確立しました。閉ループで毎回の実行の信頼性を保証し、進化で閉ループ自体の劣化を防ぎます。3つの章はそれぞれ1つの問題を解決し、合わせて持続的に運用可能な体系を構成します。
規約が解決するのは意図の伝達です。Agentはcontextに存在する情報のみを処理し、書かれていない意図は存在しないのと同じです。情報の階層化(vision → architecture → feature → task)によって異なる抽象レベルの知識がそれぞれの場所を持ち、3つの次元(意図、受け入れ基準、制約)が各層の重要な問いに明示的に回答されることを保証します。Specは使い捨てのドキュメントではなく、人とAgentの間で意図を整合させ続ける持続的な媒体です。人が意図の唯一の審判である理由は、意図が人の頭の中にしか存在しないからです。
検証が解決するのは実行の確認です。検証のアンカーは規約であり、コードではありません。テストは振る舞いの正確性を検証し(specが述べた機能をコードが実現しているか)、code reviewは意味的な完全性を検証します(コードがspecの枠組みから逸脱していないか)。両者は異なる次元をカバーしており、どちらが欠けても不十分です。検証は前倒し、プロセス中、モジュール化でなければなりません。Agentのドリフトは実行プロセス中に継続的に発生するため、最後にまとめて検証することは数十の問題が同時に噴出する事態に直面することを意味します。
進化が解決するのは体系の維持です。Specは陳腐化します。これは構造的必然です。毎回のイテレーションがspecとコードの間のドリフトを生み出し、陳腐化したspecは閉ループに誤った目標を保護させます。Changeパッケージのプロセスがドキュメントの進化を再現可能なエンジニアリングアクションに変えます。変更ごとにspecレベルの完全な記述があり、作成時と統合後にそれぞれ検証を実行し、アーカイブで意思決定の経緯を保全し、同期検出で残留ドリフトを補捉します。
3つの章は3つの独立したツールではありません。規約が検証にアンカーを提供し、良いspecがなければ検証は何を検証しているか分かりません。検証が進化に信頼を提供し、specの一貫性を検証できるからこそ増分更新を行う勇気が持てます。進化が規約の寿命を延ばし、規約は継続的に更新されてこそ検証のアンカーとして機能し続けます。3つは循環を構成しており、どの環節が断裂しても、残りの2つは機能しなくなります。
この体系の実行主体は人です。人がspecを書き、人がreviewを行い、人が意図の整合を判断し、人がドキュメントの進化を維持します。現段階では、一人が順番にいくつかのfeatureを開発する場合、各環節のコストは制御可能です。しかしコストはプロジェクト規模とともに増大します。Feature数が一桁から数十に増えると、クロスチェック、ドキュメント保守、同期検出の人的投入は、もはや各featureあたり30分でカバーできるものではなくなります。これは方法論の欠陥ではなく、human-in-the-loopモデルの本質的な限界です。
第二巻の問いは、Agentに閉ループの維持をより多く担わせ、人がより上位の監督ポジションに退くにはどうすればよいか、です。Agentの前に座って一歩ずつ指導する段階から、タスクを設計してAgentに自律的に完了させる段階へ、さらに複数のAgentを同時にディスパッチして並列に推進する段階へ。この転換の前提は、第一巻で確立した閉ループと進化のメカニズムです。規約がなければ、Agentの自律実行はVibe Codingの自動化に過ぎません。検証がなければ、Agentの成果物は信頼できません。進化がなければ、体系は最初のイテレーション後に腐敗し始めます。手を離す前提は、セーフティネットが存在することです。
Harness Engineering Playbook · AgentsZone Community