SQLさよなら？！ Google Agent Development Kitで「自然言語でデータ分析」エージェント作ってみた！ 🚀

2K Views

November 24, 25

#AIエージェント #Google Agent Development Kit #データ分析 #BigQuery #RAG

スライド概要

sokuhon_kimu

@kimu-sokuhon

スライド一覧

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.5M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.3M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.2M

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

ue5 cedec+kyushu ue-animation ue-optimize ue-bp ue-physics ue-sequencer

エピックゲームズジャパン 1M

【DeNA】新卒エンジニア向け会社説明資料

DeNA新卒採用 1M

各ページのテキスト

SQLさよなら？！ Google Agent Development Kitで「自然言語でデータ分析」エージェント作ってみた！株式会社電算システム金碩鴻（きむそくほん）プリセールスエンジニア

本日の流れ AIエージェントとADKとは？ (The "What") デモ：Data Analytics Agent (The "How") 課題：現場で本当に使える？ (The "But...") 解決策：AIに「文脈」を教える (The "Solution")

1. The "What" - そもそも「AIエージェント」「ADK」とは？ ADK (Agent Development Kit) とは？エコシステム (GCPでの動かし方) 目標を追求し、タスクを完了させる Google が開発したAIエージェントの Agent Engine: AIエージェントに最適ソフトウェアシステムです。 OSSフレームワーク。PythonやJava 化された実行環境。 AI エージェントとは？ AI を使用して、ユーザーの代わりにで利用可能です。 Gemini Enterprise: ADKを含む、 Googleのエージェントを呼び出すためのプラットフォーム。

2. The "How" - 何が進化したのか？：これまで (Gemini in BigQueryなど) 自然言語 → SQLに変換し、「データ」（例: salesテーブル）にクエリを実行していました。これは主に「データエンジニア」向けでした。

2. The "How" - 何が進化したのか？：現在のADK GoogleのBigQueryのファーストパーティツールセットにより、 ADKで自然言語で、INFORMATION_SCHEMAを用いて、 BigQueryに対してクエリできるようになりました。

2. The "How" - 何が進化したのか？： INFORMATION_SCHEMA がなぜ重要か？ INFORMATION_SCHEMA は「データのためのデータ」です。「どのテーブルが一番大きい？」「パーティションが切られていないテーブルは？」といった、 DB管理者やデータエンジニアの高度な質問にも答えられるようになります。

【DEMO】 BigQueryの"中の人"（DBA）に質問してみる「プロジェクト内で、最もデータ量の多いデータセットを教えてください。」「直近1ヶ月でデータ量が増えたデータセットは？」「パーティション化されていない『巨大な』テーブルはどれか？」（SQLだとリージョン指定やINFORMATION_SCHEMAのJOIN が面倒だけど、エージェントが全部やってくれる！）

課題提起：本当に「SQLさよなら」？自然言語でクエリが書けた！ラッキー！ → 非エンジニアにとっては間違いなく朗報です！しかし... 現場で本当に使えるでしょうか？ AIはユーザーの「意図」や「文脈」をどこまで理解できるのでしょう？

3. 課題①：スキーマ曖昧性 (Schema Ambiguity) 部署ごとの平均給与はいくらか？部署のテーブルって｀current_departure｀と｀departure_2022｀テーブル二つある。どちらを見に行けばいい？どのテーブルのどのカラムでクエリするのかが不明

10.

3. 課題②：セマンティック曖昧性 (Semantic Ambiguity) 過去30日間で最も売れた商品は？「最も売れた」というビジネス上の定義は... 解釈A: 販売個数 (SUM(quantity)) が最多か？解釈B: 販売金額 (SUM(quantity * price)) が最多か？解釈C: 注文件数 (COUNT(DISTINCT order_id)) が最多か？ビジネスロジック上、複数の異なる計算方法で解釈できてしまう

11.

3. 課題③：ドメイン曖昧性 (Domain Ambiguity) 今月の『アクティブユーザー数』を教えてスキーマに｀active_users｀というカラムはない。社内定義は... 定義A: 「今月一度でもログインした人」か？定義B: 「今月一度でも課金した人」か？定義C: 「今月商品をゲットした人」か？ユーザーは、DBに存在しない「社内用語」を使うが、 AIは理解できない。

12.

3. 結局何が問題なのか？： AIは「コンテキスト」を知らない DBを操作するには、SQLの知識があれば良いわけではない。・DBに用いられている業務ドメインの知識・開発者の設計意図・プロダクトの歴史的背景というコンテキスト（文脈）を理解してクエリする必要がある。問い: これらの高度な「コンテキスト」を、どうやって生成AIに伝えれば良いでしょうか？

13.

4. スキーマ曖昧性への解決策：メタデータの強化部署ごとの平均給与はいくらか？｀current_departure｀は現在の部署｀departure_2022｀は2022年時点での部署。特に指定はないから、現在の部署でクエリする！メタデータによって、マッピングがうまくいく。！

14.

4. セマンティック曖昧性への解決策：聞き返す AIが「推測」するのを防ぐ「過去30日間で最も売れた商品は？」「確認です。『最も売れた』とは、販売個数と販売金額のどちらで集計しますか？」メリット: AIが「間違った答え」を自信満々に返すという最悪の事態を防げる。デメリット: 「毎回聞き返してくるAIは、ちょっと面倒...」

15.

4. ドメイン曖昧性への解決策：RAG AIに「ドメイン知識の教科書」を渡す RAG:Retrieval-Augmented Generation 生成AIが回答を作成する際に、あらかじめ用意された社内文書やウェブサイトなどの信頼できる情報源から関連情報を検索し、その内容を基に回答を生成する技術コンセプト: ユーザーの質問に応じて、関連するコンテキスト（スキーマ定義、ビジネスルール、過去のSQL例）を外部の知識ベース（Vector DBなど）から動的に検索し、プロンプトに注入する。

16.

4. ドメイン曖昧性への解決策：RAG 1. 「今月のアクティブユーザー数は？」 6. 「今月1000人です」 2. RAG: (知識ベースを検索) 4. 定義に沿ってSQLを生成 5. 結果を返却 3. 「今月一度でもログインした人」という定義を発見

17.

4. 最適解：メタデータ＋RAG ＋聞き返すエージェント理想のアーキテクチャ: ・メタデータ（例：部署）でスキーマ曖昧性を解決。・RAGがドメイン曖昧性の質問（例：アクティブユーザー）を解決。・メタデータやRAGで解決できないセマンティック曖昧性（例：最も売れた商品）だけをユーザーに確認し、間違いを防ぐ。 →回答の精度とスピードを両立する

18.

まとめ：AIエージェントは「育てる」もの ADKは「自然言語でデータ分析」エージェントを構築する強力なフレームワークです。しかし、「SQLが書ける」だけでは不十分。現場の「コンテキスト（文脈）」をAIにどう伝えるかが鍵です。メタデータ強化（基盤）に加え、RAG（教科書を与える）と対話型エージェント（聞き返す）を組み合わせることで、実用的なエージェントが実現します。

SQLさよなら？！ Google Agent Development Kitで 「自然言語でデータ分析」エージェント作ってみた！ 🚀