ハーネスエンジニアリング入門 — AIに「書かせる」から「品質を維持し続ける」へ

562 Views

June 11, 26

#claudecode #生成ai #aiエージェント #contextengineering #AI #ハーネス・エンジニアリング #コード生成 #品質管理 #開発効率

スライド概要

AIにコードを書かせる時代、成果が出る人と出ない人の差はどこにあるのか。差を生むのは、モデルの賢さよりもAIを動かす「ハーネス（馬具）」の設計です。

このスライドは、ハーネスエンジニアリングの考え方を、コンテキスト管理・制約の強制・品質フィードバックの3層で12枚にまとめた入門編です。AIが書いたコードの品質を、人間が逐一確認しなくても維持できる状態をどう作るかを扱います。

全体像と実装は関連書籍にまとめています。

▼関連書籍『ハーネス・エンジニアリング』Zenn Book（¥1,500）
https://zenn.dev/kenimo49/books/harness-engineering-guide

▼Kindle版
https://www.amazon.co.jp/dp/B0GF8VGSPC

著者: ken imoto / kenimoto.dev

井本賢

@kenimo49

スライド一覧

Propel-Lab代表。WebRTC・音声AIのエンジニアをやりながら、LLMを仕事の戦力にするための設計を研究しています。中心テーマは「ハーネス・エンジニアリング」——AIの成果はモデルそのものより、その外側の環境（制約・フィードバック・ツール）で決まる、という考え方です。これとContext Engineering、AIコードレビューの自動化などをZennとKindleで本にしてきました。ここには各本の要点をスライドにまとめて置いていきます。詳しくは kenimoto.dev へ。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

AIコードレビューを仕組み化する ― hooks・AI・人間の3層モデル

コードレビュー claudecode coderabbit hooks aiエージェント生成ai

井本賢 12.1K

コードレビュー指摘300件を3ヶ月分類したら効いていたのは2種類だけだった ─ Bug/Spec死守・残り4種類はPRから外す

コードレビューハーネスエンジニアリング aiコードレビュー開発生産性メトリクス conventionalcomments

井本賢 8.4K

1Passwordが渡していない2つのもの ― マスターパスワードと、チーム共有鍵

セキュリティ 1password 暗号認証 srp パスワード管理 contextengineering

井本賢 2.4K

もうプロンプトは書かない、ループを書く ― Claude Code作者とOpenClaw作者が辿り着いた /goal と /loop

claudecode aiエージェント生成ai 自動化 llm ハーネスエンジニアリング contextengineering

井本賢 2.2K

9Bが死んで35Bが動く — RTX 4070でQwen 3.5を全モデル検証

ローカルllm qwen gpu ollama 生成ai

井本賢 2.2K

cpu-moeで満足するな — Qwen 35Bをさらに速くする3フラグ実測 (RTX 4070)

ローカルllm llama.cpp rtx4070 qwen 生成ai

井本賢 2.2K

各ページのテキスト

HARNESS ENGINEERING AIを"使う"から "操る"へコードを書かせるより、品質を維持し続ける技術 ken imoto エンジニア / Propel-lab AIを"使う"から "操る"へハーネスエンジニアリング Ken Imoto ハーネス・エンジニアリング kenimoto.dev

AIが書いたコード、誰が見ている? Claude CodeやCodexで自動生成は当たり前になった。問題はその先にある。「AIが書いたコード、ちゃんとレビューできてる?」速く書けるほど、確認の負担だけが積み上がっていく。ハーネス・エンジニアリング 02 kenimoto.dev

3人で、5ヶ月、100万行 OpenAIのCodexチームの実績。手書きのコードは0行、すべてエージェント生成。 3 人のエンジニアで開発 (現在は7人) 100万行のコードベースを 5ヶ月で構築 3.5PR 1人あたり/日のスループットを維持すごいのは「書けた」ことではなく、品質を維持し続けられたこと。ハーネス・エンジニアリング 03 kenimoto.dev

ハーネス = 馬具の設計馬(AI)を自由に走らせつつ、暴走させない。手綱・鞍・轡をどう組むか。エンジニアの仕事は、もはやコードを書くことではない。環境を設計し、意図を指定し、フィードバックループを構築することだ。 AIエージェントの価値 = 出力の便利さ - 人間の確認コストハーネス・エンジニアリング 04 kenimoto.dev

なぜAIで成果が出ないのか多くの企業はAIを導入した。でも、ハーネスを構築していない。 1 AIツール導入 → コード生成が速くなる → 便利! 2 でもレビュー体制は従来のまま → 人間が全部確認し直す 3 確認コストが増え、手戻りも増える 4 トータルの生産性は変わらない、むしろ下がる 5 「AIは使えなかった」 → 棚上げハーネス・エンジニアリング 05 kenimoto.dev

実践① コンテキスト管理 CLAUDE.mdで「使わない技術」を宣言する。これが一番効いた。 # CLAUDE.md / 技術スタック - ORM: SQLAlchemy (asyncは使わない) - 認証: セッション (JWTは使わない) - フロント: React (Next.jsは使わない) 「やらないこと」を書くだけで確認コスト激減目安は500行以下。百科事典でなく目次として設計する。OpenAIのAGENTS.mdも約100行。ハーネス・エンジニアリング 06 kenimoto.dev

実践② 制約の強制 CLAUDE.mdでTDDを叩き込む。これはコーディング規約ではなく機械的な制約だ。 # 開発ルール(厳守) 1. 変更前に必ずテストを書く 2. 既存テストを削除・スキップしない 3. テストが通らない状態でコミットしない 4. 1コミット1変更 AIが暴走しないための機械的な制約 CLAUDE.mdの制約はコンパクション後も残るため、長いセッションでもルールが維持される。ハーネス・エンジニアリング 07 kenimoto.dev

実践③ 品質フィードバック AIが書いて、AIがレビューする。人間の出番は最終判断だけになる。 Claude Code コード生成 → CodeRabbit AIが一次レビュー → E2Eテスト Playwright自律実行 → マージ判断人間はここだけ Codexチームはレビューのほぼ全てをagent-to-agentに移行。人間レビューはオプション。ハーネス・エンジニアリング 08 kenimoto.dev

3層が重なると何が起きるか Codexの100万行も、個人開発も、規模が違うだけで原理は同じ。 ① コンテキスト管理 AIが何を知っているか CLAUDE.md + AGENTS.md ② 制約の強制 AIが何をしてはいけないか TDDルール+リンター ③ 品質フィードバック AIの出力が正しいか E2Eテスト+AIレビュー AIが書いたコードの品質を、人間が逐一確認しなくても維持できる状態が生まれる。ハーネス・エンジニアリング 09 kenimoto.dev

10.

ハーネスなし vs ハーネスあり同じAIを使っても、手綱の有無で確認コストは正反対になる。ハーネスなし - AIが自由に書く - 人間が毎回全部レビュー - テストは忘れがち - 技術的負債が蓄積 - 確認コストが高い → ハーネスあり - AIがルールに従って書く - AIが一次レビュー、人間は最終判断 - テストが先、実装が後(TDD) - 制約とフィードバックで品質維持 - 確認コストが低いハーネス・エンジニアリング 10 kenimoto.dev

11.

今日から始める4ステップ一度に完成させるものではない。Step 1だけでも確認コストは大きく変わる。 STEP 1 / 10分 CLAUDE.mdに制約を書く「やっちゃダメ」を3行。使わない技術を宣言。 STEP 2 / 5分 TDDルールを追加テスト先行→Red→実装→Green→コミット。 STEP 3 / 5分 Playwright MCPを接続 E2Eテストの生成→実行→修正を自律化。 STEP 4 CIにAIレビュー CodeRabbit等をGitHub Actionsに追加。まずはCLAUDE.mdに3行書くところから。ハーネス・エンジニアリング 11 kenimoto.dev

12.

手綱の全体像は、この本に。 Zenn Book ¥1,500 zenn.dev/kenimo49/books/harness-engineering-guide Kindle amazon.co.jp/dp/B0GF8VGSPC AIを"使う"から "操る"へハーネスエンジニアリング Ken Imoto コンテキスト管理・制約の強制・品質フィードバックの3層を、実装コードと事例で体系化。AIを"使う"から"操る"へ。 kenimoto.dev ハーネス・エンジニアリング 12 kenimoto.dev

ハーネスエンジニアリング入門 — AIに「書かせる」から「品質を維持し続ける」へ

井本 賢

関連スライド

AIコードレビューを仕組み化する ― hooks・AI・人間の3層モデル

コードレビュー指摘300件を3ヶ月分類したら効いていたのは2種類だけだった ─ Bug/Spec死守・残り4種類はPRから外す

1Passwordが渡していない2つのもの ― マスターパスワードと、チーム共有鍵

もうプロンプトは書かない、ループを書く ― Claude Code作者とOpenClaw作者が辿り着いた /goal と /loop

9Bが死んで35Bが動く — RTX 4070でQwen 3.5を全モデル検証

cpu-moeで満足するな — Qwen 35Bをさらに速くする3フラグ実測 (RTX 4070)

各ページのテキスト

井本賢