Google Cloud Next Tokyo ’25_これがフルパワーだ!BigQuery のメタデータで Gemini が完全体に

2.6K Views

August 06, 25

スライド概要

profile-image

株式会社 MBK Digital 執行役員 CTO。データエンジニアリングの分野で長年の経験を持ち、Google Developer Expert としても活動中。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

これがフルパワーだ! BigQuery のメタデータ で Gemini が完全体に Proprietary

2.

Proprietary イワオ カズマサ 岩尾 一優 株式会社 MBK デジタル 執行役員 CTO Google Developer Experts Google Cloud Next Tokyo 02

3.

Proprietary 株式会社 MBK デジタル( 2025 / 4 / 1 設立) 企業のデータ活用 / AI 活用を支援 ● ● コンサルティング & 受託サービス ○ データ分析 / データ基盤構築 ○ 生成 AI アプリケーション開発 自社開発プロダクト ○ Collectro(データ収集) ○ BI Suite(AI-Powered BI ツール) ○ AI Craft(生成 AI アプリ作り放題) ○ Bizschola(データ人材育成講座) Google Cloud Next Tokyo 03

4.

Proprietary 発表サマリー AI との対話によるデータ活用が本格化する現代 において、 回答の精度を高める鍵の 1 つは「BigQuery のメタデータ」です。 本セッションでは、 ビジネスメンバーでも簡単に実現できる 実践的なメタデータ整備プロセスをご紹介します。 Google Cloud Next Tokyo 04

5.

Proprietary BigQuery のメタデータ自動生成 (2025 / 06 / 18 より Preview) 対応言語が「英語のみ」「生成のためのプロンプトのチューニングができない」 などの制限があるため、今回は現時点でより柔軟で精度の高い別の方法を解説します。 Google Cloud Next Tokyo 05

6.

Proprietary 01. なぜ「今」、 メタデータの話をするのか? Google Cloud Next Tokyo 06

7.

Proprietary 「AI との対話による分析」の本格化 4 月にラスベガスで現地参加した Google Cloud Next 25 でも ● ● ● Looker BigQuery data canvas Google Agentspace などを用いて AI と対話をしながら データ分析を行うセッションが 大きな注目を集めていた。 Google Cloud Next Tokyo 07

8.

Proprietary 「AI との対話による分析」の本格化 また、最近新たに Looker の MCP サーバーが登場。 ● ● Gemini CLI Claude などをクライアントとして AI が Looker に直接アクセスし、 対話形式でデータ分析を行うデモが公 開された。 https://www.linkedin.com/posts/szinsmeister_googledatacloud-activity-7354218061039603712-ja4Y Google Cloud Next Tokyo 08

9.

Proprietary 「AI との対話」を成功させる 2 つの鍵 モデルの性能に加え以下が重要。 1. 効果的なプロンプトの作成技術 2. AI が理解できる、整備されたメタデータ 本発表では、AI との対話による分析の土台となる BigQuery のメタデータ整備に焦点を当て、 その重要性と実践的なアプローチをご紹介します。 Google Cloud Next Tokyo 09

10.

Proprietary メタデータの定義と価値 メタデータの定義 データを説明するためのデータ 例: BigQuery のテーブルやカラムの description ● ● 価値 ● ● 人間にとって : データの検索性の向上 AI にとって : SQL 生成や分析の自動化 メタデータは、人間と AI の両方にとって、 データを効果的に活用するための共通言語となる。 Google Cloud Next Tokyo 010

11.

Proprietary メタデータ整備の課題 メタデータの重要性は広く認識されているが、実際に は多くの企業で整備されていない。 なぜか? ● ● ビジネスメンバーはデータの意味を知っている が、整備する手段に明るくない。 エンジニアは整備する技術を持つが、 主業務が優先され、後回しになりがち。 結果、メタデータ整備は「誰の仕事でもない」状態に 陥り、後回しにされてしまう。 Google Cloud Next Tokyo 011

12.

Proprietary 提案 ビジネスメンバー自身が主役 となり簡単かつ効率的に整備できる「新 しいメタデータ整備プロセス」を導入すること。 Google Cloud Next Tokyo 012

13.

Proprietary 02. AI で加速する メタデータ整備プロセス Google Cloud Next Tokyo 013

14.

Proprietary シンプルな 3 ステップで BigQuery のメタデータを整備 ① 対象の優先度付け ② Gemini で メタデータを生成 ③ BigQuery へ メタデータを反映 数百のテーブルが存在しても、頻 繁に使われる重要なテーブルはご く一部。 Gemini がテーブル/カラムの description の下書きを生成。 レビューが完了した description を インプットとして、Gemini が ALTER TABLE 文を生成。 人間はレビューと修正に集中。 人間は生成された SQL を確認・実 行するだけで、メタデータを BigQuery へ反映できる。 Google Cloud Next Tokyo 014

15.

Proprietary ① 対象の優先度付け BigQueryの利用履歴 (INFORMATION_SCHEMA.JOBS) を分析しテーブルごとの参照回数をラン キング化(右の SQL)。 プロジェクト、データセット、テーブルごとに 参照回数をランキング化 Google Cloud Next Tokyo -- よく使われるテーブルをランキング化 SELECT t.project_id, t.dataset_id, t.table_id, COUNT(*) AS reference_count FROM -- ▼ your-region は実際のリージョンに変更 `your-region`.INFORMATION_SCHEMA.JOBS_BY_PROJECT, UNNEST(referenced_tables) AS t WHERE DATE(creation_time, 'Asia/Tokyo') >= CURRENT_DATE('Asia/Tokyo') - 30 AND job_type = 'QUERY' AND state = 'DONE' AND error_result IS NULL GROUP BY 1, 2, 3 ORDER BY reference_count DESC; 015

16.
[beta]
Proprietary

② Gemini で
メタデータを生成
SELECT
t.project_id, t.dataset_id, t.table_id,
COUNT(*) AS reference_count
FROM
`region-us`.INFORMATION_SCHEMA.JOBS_BY_PROJECT,
UNNEST(referenced_tables) AS t
WHERE
DATE(creation_time, 'Asia/Tokyo') >= CURRENT_DATE('Asia/Tokyo') - 30
AND job_type = 'QUERY'
AND state = 'DONE'
①BigQuery テーブルの「スキー
AND error_result IS NULL
GROUP BY
マ」タブでフィールド名をチェックし
t.project_id, t.dataset_id, t.table_id
「JSON 形式でコピー」を選択す
ORDER BY
る。
reference_count DESC;

②取得したスキーマを右のプロン
プトにコピーして実行する。

Google Cloud Next Tokyo

# 命令
あなたは EC サイトを運営する企業のデータアナリストです。
以下のテーブルスキーマ情報に基づき、BigQuery のメタデータとして利用するテーブ
ルと各カラムの description を、簡潔で分かりやすい日本語で生成してください。
# 制約
- 出力は必ず JSON 形式とします。
- テーブルの description は tableDescription キーに、カラムの description は
columns 配列内の各要素に含めてください。
# 入力スキーマ
<BigQuery テーブルのスキーマ>
# 出力形式
{
"tableDescription": "(ここにテーブル全体の概要説明を生成)",
"columns": [
{
"name": "(カラム名 1)",
"description": "(ここにカラム 1 の説明を生成)"
},
{
"name": "(カラム名 2)",
"description": "(ここにカラム 2 の説明を生成)"
}
]
💡プロンプトにドメイン知識を
}

入れると更に精度が向上
016

17.

Proprietary ② Gemini で メタデータを生成 1. 前ページのプロンプトから、 右の JSON(description 案) が出力される。 2. これをビジネスメンバーが ブラッシュアップ。 ゼロから人間が整備するより 90% 程度の工数削減になる。 Google Cloud Next Tokyo { "tableDescription": "各商品の日ごとの売上金額、ユニーク購入者数、平均 販 売価格を集計したテーブルです。", "columns": [ { "name": "sales_date", "description": "売上が計上された日付" }, { "name": "product_id", "description": "商品を一意に識別するためのID" }, { "name": "total_sales_amt", "description": "該当日の合計売上金額(円)" }, { "name": "unique_purchasers", "description": "該当日に商品を購入したユニークユーザー数" }, { "name": "avg_price", "description": "該当日の商品の平均販売価格(円)" } ] } 017

18.
[beta]
Proprietary

③ BigQuery へ
メタデータを反映
ALTER TABLE 文を生成し利用。
※既存のテーブルのスキーマを変更
するための SQL コマンド
ブラッシュアップ済みの JSON
(description)を右のプロンプトにコ
ピーして実行する。

Google Cloud Next Tokyo

あなたは BigQuery を専門とする、熟練のデータエンジニアです。
以下の `テーブル名` と `JSON形式のメタデータ` を基に、BigQuery で実行す
る DDL(ALTER TABLE 文)を生成してください。
# 制約
- テーブル本体の説明には`ALTER TABLE ... SET
OPTIONS(description="...")` を使用。
- 各カラムの説明は `ALTER TABLE ... ALTER COLUMN ...` 形式で 1 文にまと
める。
- SQL コードのみを生成し、前置きや説明は一切含めないこと。
# テーブル名
`your-project.dm_sales.daily_sales_summary`
# JSON 形式のメタデータ
{
"tableDescription": "(レビュー済みのテーブル説明文...)",
"columns": [
{ "name": "sales_date", "description": "(カラム1の説明...)" },
{ "name": "product_id", "description": "(カラム2の説明...)" },
... (以下略)
]
}

018

19.

Proprietary ③ BigQuery へメタデータを反映 1. 前ページのプロンプトから、 ALTER TABLE 文が出力される。 2. これを BigQuery のコンソールで 実行する。 Google Cloud Next Tokyo ALTER TABLE `your-project.dm_sales.daily_sales_summary` SET OPTIONS(description="商品ごとの日次売上実績を格納するサマリー テーブル。"); ALTER TABLE `your-project.dm_sales.daily_sales_summary` ALTER COLUMN sales_date SET OPTIONS(description="売上日。この行 のデータが集計された日付。"), ALTER COLUMN product_id SET OPTIONS(description="商品のユニーク な識別子。商品マスターと結合するためのキー。"), ALTER COLUMN total_sales_amt SET OPTIONS(description="その日にそ の商品が売り上げた合計金額(税抜)。"), ALTER COLUMN unique_purchasers SET OPTIONS(description="その日 にその商品を購入したユニークユーザーの数。"), ALTER COLUMN avg_price SET OPTIONS(description="その日のその商 品の平均販売価格。"); 019

20.

Proprietary 補足(Gem) 各プロンプトを Gem(専用の AI アシス タント)として保存することを推奨。 ● ● 入力の手間を省きつつ、品質の 高いメタデータ / DDL を生成。 生成の過程で得た学びを Gem のカスタム指示に追加しプロンプ トを育てていく。 Google Cloud Next Tokyo 020

21.

Proprietary 03. 得られる効果 Google Cloud Next Tokyo 021

22.

Proprietary 従来の課題 データ探索と SQL 実装は 専門家にとっても大きなボトルネック。 AI との対話によるデータ活用において、 この一連のプロセスがどう変わるのか見てみましょう。 Google Cloud Next Tokyo 022

23.

Proprietary 【例】Gemini のアシスタント機能 BigQuery のコンソール上で 「Gemini を使用して SQL を作成」機能 を利用し、 自然言語で曖昧な指示を実施。 人気 = 売上金額が大きい と AI が判断 AI が多くのテーブルから 該当テーブルを特定 Google Cloud Next Tokyo 023

24.

Proprietary その他、メタデータ整備の期待効果 曖昧なカラム名を AI が理解 ● 「tmp_flg」のような曖昧なカラム名も、 メタデータがあれば AI が「仮会員フラグ」のよう にビジネス上の意味を理解。 AI と対話するだけでデータ分析が完了 ● Looker の Conversational Analytics や MCP サーバーがメタデータを参照。 「先月の売れ筋商品は?」と話しかけるだけで 結果を提示。 Google Cloud Next Tokyo 024

25.

Proprietary 得られる効果のまとめ ● ● メタデータを整備することで AI が 「データ探索」や「SQL 実装」する際の 精度が大幅に向上。 メタデータ整備は、もはや単なる「お作法」では なく、AI の能力を最大限に引き出すための戦略 的な投資と言える。 Google Cloud Next Tokyo 025

26.

Proprietary 04. まとめ Google Cloud Next Tokyo 026

27.

Proprietary まとめ AI との対話によるデータ活用が本格化する現代にお いて、回答の精度を高める鍵の 1 つである 「BigQuery のメタデータ」整備についてご紹介しまし た。 本日の発表が、皆様のデータ活用を一段階先へ進 める一助となれば幸いです。 ご清聴いただき誠にありがとうございました。 本資料は弊社テックブログ にて公開予定 Google Cloud Next Tokyo 027

28.

Proprietary Ask the Expert にぜひお越しください Google Cloud に関する技術的なご質問に GDE( Google Developers Experts )がお答えします! Stage 本ステージの後方にございますので、 ぜひお立ち寄りくださいませ! Ask the Expert Google Cloud Next Tokyo 028