>100 Views
February 12, 26
スライド概要
Foundation Capitalが提唱し話題の「コンテキストグラフ」。AIエージェントが賢く動くために必要なのは、データ量ではなく「なぜその選択をしたか」という文脈データだった──。月間3,000万UUの選択行動データを持つマイベストが、OBT・セマンティックレイヤー・ファクトDBで文脈を構造化し、AI-Readyな基盤を泥臭く作っている取り組みを紹介します。
2026.02.12 @ SmartHR Space
AIエージェントに必要なのは データではなく「文脈」だった マイベストが泥臭く作っている "コンテキストグラフ" の話 内藤 純 / 株式会社マイベスト 2026.02.12 @ SmartHR Space
01 自己紹介
自己紹介 株式会社マイベスト プロダクト部 データサイエンスチーム マネージャー 内藤 純 ■経歴 ヘルスケア、メディア、小売、人材、教育など多様な業界において、ビジネスデータ活用の 上流から下流まで一貫して担当。統計解析、機械学習モデルの開発、データ基盤の構築、 諸々の運用、チームマネージメント等幅広く従事。データがあればいい感じにする汎用型よ しなにデータ人材。 @njun_data @njun マイベストのデータサイエンスチーム立ち上げにあたり、2024年8月に参画 3
自己紹介 マイベストのユニークさ 「ランキングサイトでしょ?」と思われがちですが── 裏側では 実際に商品を買って泥臭い検証 をしています この 泥臭さ は検証だけじゃなく、データの整備にも及んでいる。 今日はその話をします 4
02 世界の最新潮流 「コンテキストグラフ」
世界の潮流 いま海外のデータ・AI界隈で起きていること VCの Foundation Capital が論文を発表し、大論争に 「AIの 1兆ドル(約150兆円) のビジネスチャンス」 データカタログ企業 Atlan CEO が真っ向から反論 データ業界の著名人が次々と議論に参戦 「コンテキストグラフ」= 意思決定の「なぜ」を構造化した次の1兆ドル市場 Foundation Capital "Context Graphs: AI's Trillion-Dollar Opportunity" / Atlan CEO Prukalpa "But Who Actually Captures It?" 6
世界の潮流 AIに必要なのは「なぜ」の文脈。でも誰が持っている? CRM/ERPにあるのは 「何が起きたか」 だけ。AIが賢く 動くには 「なぜ」の文脈 が要る OpenAIやGoogleが持ってる? → No. ユーザーがなぜその商品を選んだかはLLMの学習データ にない。各企業のサービス上にしか存在しない ユーザーの「なぜ」を構造化して持てる企業だけが、AIで勝てる Foundation Capital "Context Graphs" / Atlan CEO Prukalpa "But Who Actually Captures It?" 7
では、この「なぜ」を持っている企業はどこか? マイベストは「なぜAではなくBを選ぶのか」を丸ごと持 っている 月間 3,000万UU が「何を買うか迷っている瞬間」のデ ータ モニター30人の自由記述・官能評価・検証写真 専門家のレビュー文 あらゆるジャンル × 老若男女 × 8カ国 Amazonは「何を買ったか」を知っている。 マイベストは 「なぜ迷い、なぜ選んだか」 を知ってい る コンバージョンの手前──「選択の文脈」を構造化して持てる企業は多くない 8
03 ツラミと向き合い方
ツラミ(1) ユーザーの「なぜ」を理解するのに、これだけのデータ が要る メディアにも実はこれだけの種類のデータがある データ ユーザー理解での役割 検索ログ 何に興味を持って来訪したか 検証スコア・商品DB 商品をどう評価したか 行動ログ どう回遊し、何を読了したか CVログ 最終的に何を買ったか 定性データ モニターがなぜそう感じたか 業務知識 各部署の暗黙知 ユーザーの「なぜ」を知るには、膨大な種類のデータを集めて構造化する必要がある 10
向き合い方 ① One Big Table ── AI時代に改めて最適解だった データ界隈で再評価が進んでいるOBTをマイベストでも 採用 Before: 4システムを手動で突き合わせ After: 検索ログ × 行動ログ × CVログ × 定性データを 1テーブルに事前結合。LLMにもそのまま渡せる スター型比で読み取り性能 10〜45%向上 の報告あり。 MLの特徴量ベクトルと同じ構造で、LLMとの相性も良 い AIが賢く動くには、まずデータが1テーブルで読める状態にあることが前提 Eugene "The One Big Table" / Brooklyn Data "Hybrid Kimball & OBT" 11
向き合い方 ② セマンティックレイヤー ── 人間とAIの共通言語 OBTでデータは揃った。でも「CVR」の定義が人によって違ったら、AIも人間も同じ答えにたど り着けない ファクトDB → アドホック分析の結果を出しっぱなしにせずDBに蓄積。「売上+12%はキャンペ ーン効果か、季節要因か」──こうした分析のファクトが溜まることでAIの文脈になる セマンティックレイヤー → 「CVR = 購入数 / セッション数」のような定義をコードで管理。 Claude/Cursorルールにも組み込み、AIが同じ定義でデータを扱える AIに「CVRを出して」と頼んだとき、人間と同じ定義で計算できる かどうかが勝負 設計も含めて泥臭い人間の仕事。ここを避けてAIで近道はできない 12
まとめ OBT × セマンティックレイヤー = AI-Ready OBT でデータを1テーブルに集約し、セマンティックレ イヤー で定義を揃え、ファクトDB でアドホック分析の 結果を蓄積する。この3つが揃ってはじめて、AIがユー ザーの「なぜ」を読める状態になる これがマイベスト版のコンテキストグラフ──選択の文 脈をデータ基盤として構造化したもの。派手なAI技術の 前に、この泥臭い基盤づくりが競争力の本質 13
04 可能性とまとめ
可能性 文脈データがあると、AIで何ができるか どれも「文脈がコードで定義されている」から実用化 施策 AI接客 文脈があるからできること 「肌が弱い人向けの日焼け止めは?」に検 証データを根拠に即応答 AIコンテン ツ制作 評価基準が定義済み → AIが下書き → 人間 がレビュー。コスト約1/2 AI商品リサ 商品DBの定義が統一済みだから情報収集を ーチ 自動化 AIの精度は、モデルの性能ではなく文脈データの質で決まる 15
今日のまとめ 1. いま世界が取り合っているのは「コンテキスト」 データではなく、意思決定の「なぜ」を持つ企業がAIで勝つ時代 2. AIにできないデータの仕事がある OBT・セマンティックレイヤー・ファクトDB──文脈の構造化は人間にしかできない 3. 自社の「なぜ」を自社で持つ コンテキストはもっとも価値の高い資産。外に預けず、自分たちで構造化して育てる AIが賢く動くかどうかは、モデルの性能ではなく「文脈データの質」で決まる。その 文脈を作れるのはデータチームだけ。
「なぜ選んだか」を 価値に変えませんか? まだ眠っている「選択の文脈」を掘り起こして、 最高の選択体験と最高のAIプロダクトを一緒に作りましょう 採用: my-best.com/company/recruitment/ note: @njun / @kazumax1218 X: @njun_data 懇親会でお気軽にお声がけください!
イベント告知 キーボードとお酒と徹底検証の話 2/20(金) 19:00-21:00 @マイベスト本社in築地 キーボード50種以上、最新のディスプレイを選りすぐり のお酒とともに体験しませんか? プロダクト職種向けイベントです。現場のリアルをまる っと公開します 詳しくは https://connpass.com/event/384336/ から!