Codex CLIを経営に使ってみる

5.7K Views

September 07, 25

スライド概要

カレーちゃんのAI道場/Codex初学者勉強会 2025/09/07
LT登壇させていただきました!
関連する記事:
https://qiita.com/zazen_inu/items/be6accceb5f808d52bc8

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

我々は道具を形づくり、その後、道具が我々を形づくる。 マーシャル・マクルーハン

2.

10分 Codex CLIを経営に使ってみる @zazen_inu 2025/09/07 カレーちゃんのAI道場

3.

自己紹介 座禅いぬ(x: @zazen_inu) 普段何してるの? ・業務アプリ作成、データ分析、業務効率化 ・経営戦略、マネジにObsidian,Cursorを活用 ・マナビDXQ修了生コミュニティ運営チーム ・CDLEひろしまメンバー、勉強会開催 ・日中は診療+エージェントと協働体制構築中 資格、検定 ・G検定2025#1 ・ITパスポート ・DS検定 ・歯科医師/博士 最近のトレンド ・MDXQ2025参戦中、AI半導体講座受講中 ・SO-101というロボットの模倣学習が気になる ・結局ChatGPTはProに、ClaudeはMax ・カレーちゃんさんの朝配信でキャッチアップが楽

4.

今回の目的 Codex CLIをプログラミング用途以外に使ってみる ・以前、Obsidianをコンテキスト倉庫として管理する仕組みをLTで発 表させてもらいました ・Obsidian + Cursor、Gemini CLIの併用で、ビジネス課題を解決 しようと試行錯誤していた。効率化は実現出来ていたが、十分とは言え なかった ・コーディングエージェントを汎用エージェントとして経営業務の効率化 や調査に使えないか? ・仕事や学びの効率化、能力拡張のためにもAIエージェントのニーズが 高まっている ・最近、CodexCLIがXなどでも評判いいですよね Codex CLIのコーディング以外の活用可能性を検証したい

5.

背景 重要なのは「わかる」の同期=人間とAIが同じ文脈・理解を共有すること ・LLMの精度は高いが、アウトプットが期待通りでないことが多い ・原因はAIが賢くないからではなく、人間とAIが異なる存在であり、背 景情報や状況をAIが十分に持っていないため ・そのためAIの出力には不確実性が生じ、人間は条件を変えながら最適 な出力を探している ・この問題を解決するために「コンテキストエンジニアリング」という考え 方が注目されている ・ただし、人間にとっては「コンテキストを与える」と言われてもイメージ しづらい部分があるし、RAGなど色々技術を覚えるのは大変 まずはエージェントが情報を獲得させる挙動を学習したい

6.

先行検証 GeminiCLIでDeep Researchをマークダウンで再現してみた ・deep_research_rule.mdに調査の流れを記述 1. 役割定義 2. 最終目標設定 3. 行動原則の規定 4. ワークフローの規定 5. 例外処理 6. コマンド利用についてのガイドライン ・マークダウンファイルを生成、マークダウンに沿って内容を 参照しながら調査を続けてくれる 計画立案、考察しながらの調査を再現することに成功した

7.

学んだこと 普通にかなり複雑なことまで調査・レポート作成を行ってくれた ・googlesearch機能、超優秀。でも上限がある ・今回のポイントは「マークダウンで制御出来る」ということ ・Claude CodeやKiro等では要件定義やタスクリストで制 御するので参考にした ・RAG、MCP等を使わなくてもファイル参照や生成をコマン ド実行できる ・では、これをObsidianのVaultに行うことはたやすいで すよね? Obsidianをコンテキスト倉庫として、 AIエージェントに仕事をしてもらう基盤が整った

8.

改めて考える エージェントに仕事をさせるとはどういうことか ・やりたい仕事も勉強もたくさん、何とかしたいですよね ・ AIエージェントの「自動化」は、人間で代替出来る ・一方、自分の代わりは居ない。自分を複製することができ れば、他にはない価値が生まれる ・自分を複製して作業させるためにはどうしたらいいのか ・カギは「連続性」と「自律性」ではないか。 ・脳との「連続性」とは?=理解ではないか つまり、常に「理解が伴った」、「コンテキストに沿った自律性」を 持ったエージェントが必要

9.

「わかる」 わかる=既に獲得した知識や概念を用いて新しい概念を説明すること 「わかる」とは 1. 既に理解している構成要素に当てはめる 2. 既に理解している構造に当てはめる 3. 新しいフレームワークを構築して理解する 参考書籍:『畑村式「わかる」技術』 落とし穴があるほうの「わかる」 1.理解しているものと関連付けられると分かった気持ちになる 2. 命題に対し、まずは構成要素及び構成を見て説明をする 素材は全てvaultにある!

10.

自律性 コンテキストに沿った自律性は、厳密なルールを課すことで実現できる ・仕事の構造を以下の通り分解する 入力→状況・制約を参照→基準参照→意思決定→実行→責任と検証 ・エージェントの役割定義、権限範囲、説明責任、連絡経路、情報ソースを 決定し、成果物とログを人間が感知する ・明確なルール: ①全ての文書は人間が確認。②全ての変化は人間が承認 ・比重が重要。最小限の承認にしないと、自律性が失われる ・その為には判断ルールを移植することを考えるべき ・参照元を監査しないといけない →wikilinkで確認できるのがobsidianの強み でも、これを「いつ」実行するのが理想なの・・・?

11.

HITLサイクル 並行作業が一般的である、歯科の診療に着想を得る エージェントと並行作業するときの課題 ・常に監視していると自分の作業ができない ・ほったらかしにしていると意図からずれることがある ・要件定義をしっかりすればいいのだが、変数が多い作業だと予見 できないことがたくさんあり、明後日の方向に作業が進む 何かに似ている… ・普段、30分単位で、4列並列で仕事をしている ・歯科衛生士に、「患者の特性」「これまでの治療の流れ」「今日やる内容 (歯ブラシ指導等)のマニュアル」という情報を与える ・さらに患者をチェックし、「当日の状態」を踏まえて作業、最後に確認 それを参考にHITLサイクルを構築できるのでは?

12.

ルールの要点 ルール定義ファイルを作成する(AGENTS.mdなど) 1. スケジュール管理:30分1コマでスケジュールを構築。 2. 進捗管理:承認印がないと次のコマに進んではいけない 3. コンテキスト検索:タスクに必要な情報を判断しvaultから検索 4. 情報提供依頼書:不明な点は人間に情報提供を依頼する 5. 調査依頼書:Deep Research用プロンプトを発行させる 6. エラーログ:人間の意図と反した場合、エラーログ記載+対策提案 AIが作業し、人間は承認印と方向修正。 ポモドーロテクニックと併用可能

13.

検証と考察 本業の課題で実際に使ってみた(プレゼン、マーケティング調査) ・仕事や別の作業の合間にどんどんドキュメントが積み重なっていく。 wikilinkで参照できるから見やすい ・過去のドキュメントを最初に参照し、自社データを引っ張って来る ・情報提供依頼書はわりとめんどくさかった(要改善) ・調査依頼書がめちゃくちゃ優秀だった。こんなDeep Researchさん 見たことない(20ページの報告+insight) ・間違っている事で修正依頼すると、関連した生成物も全部修正 ・Obsidianを開いておくと自動リロードしてくれるので、どんどん更新 ・検印を押すのがワンクリックで超簡単、エージェント制御のための Obsidian もっとドキュメントを人間が書いたら精度がもっと上がりそう

14.

気付き 「調査依頼書」の実装で、Deep Researchの活用方法が変わった ・AIエージェントが要件定義や経営分析を行う中、RFIなどの市場調査 や、デファクトスタンダードやユースケースの調査が必要になる ・また、3C分析等のビジネスフレームワークで思考する場合、論点に向 けた調査が必要になる ・そこで、「調査依頼書」をエージェントに生成させることとした ・ChatGPT Deep Researchを基準として、コピペ出来るプロンプト としての調査依頼書を生成してもらう ・調査結果をpdfでダウンロードしpdftotextする ・更にエージェントが調査内容に基づき分析 Deep Researchを毎日10回近く回す生活を実現(楽しい)

15.

アップデートの仕組み インシデントレポートシステムの導入 ・しれっと一日分の作業を終わらせる ・人間の確認を実装するために検印チェックボックスを作成しているが、 当たり前のように勝手に検印を更新する ・何もせずに「作業完了しました」 ・対策をルールの更新で行うが、「どうミスしたか」と対策をペアにしたい ・「error_log.md」を作成し、対策含め生成させる ・確認後ルールを書き換えさせる(確認しないとどんどん変になる) ・ルールは英語の方が守られやすい気がする これによりエージェントの特性もわかりやすくなる

16.

エージェントの特性 ClaudeCode, GeminiCLI, CodexCLIで比較した ClaudeCode ・最初はClaude Codeで試した。ユースケース多い ・一番気持ちよく指示できるのはClaudeCode、意図を汲んでくれる GeminiCLI ・無料なのはとにかく素晴らしい ・ルールをちょいちょい守らない気がする Codex CLI ・ルールをめちゃくちゃよく守る ・専門用語や日常的でない単語を多用するため時々わかりにくい 一長一短であるが性質の違いははっきり出る

17.

まとめ 最も重要なのは、エージェントに厳しいルールを課すこと ・Gemini CLIで、マークダウンでDeep Researchを再現してみた ・Obsidianをコンテキスト倉庫としてビジネス上の課題やファクト、議 事録、学んだ知識等を蓄積した ・コンテキスト倉庫を自律的に参照して、エージェントがドキュメントやス ライドを生成する仕組みを確立できた ・外部情報はDeep Researchへの調査依頼書を生成させることで、 高度な調査を実現 ・インシデント報告書でルール調整の仕組みを構築 ・生成されるドキュメントは集約されたら捨てる。まだゴミ7割 ・それでも生産性はかなり向上している。かつ、理解が伴っている AIエージェント達との並列協働の光が見えてきた