Databricks Free Editionで Genieを触ってみた

1.6K Views

August 08, 25

スライド概要

JEDAI - The Data & AI Meetup Data + AI Summit 2025をみんなで振り返ろう!#2 (オンライン開催)にて発表した資料です。
自社で作成しているText2SQLのAgentとGenieとの精度比較について記載しております。

profile-image

DataScientistをしています

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

Databricks Free Editionで Genieを触ってみた CO NFI D ENTI AL MUF G AI Stud io Yut o Kobayash i © 2025 Japan Digital Design, Inc. 1

2.

プロフィール • 2020年9月にJDDへJoin • 1度離任を経て再度2022年にJoin(計4年所属) • 金融系SE/PM:7年 , DS5年 • 採用リクルーターも兼任 • Databricks歴:4年 最近資格を取り始めました (次はML系取得予定 ) Databricksに関する記事もちょこちょこ書いてます 小林優人 AI & Data Science Div. Senior Data Scientist CONFIDENTIAL© 2025 Japan Digital Design, Inc. 2

3.

会社概要 社名 Japan Digital Design株式会社 設立 2017年10月2日 代表者 代表取締役 CEO 浜根 吉男 従業員数 101名(2025年4月1日時点) 株主構成 株式会社三菱UFJフィナンシャル・グループ 株式会社三菱総合研究所 三菱UFJリサーチ&コンサルティング株式会社 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 3

4.

JDDの特徴 専門人材 エンジニアリング・データサイエンス・デザイン 開発インフラ データ分析基盤・クラウドIT環境 MUFGにおけるJDDの役割 Japan Digital Design株式会社(JDD)は、AI・CX・Tech領域を組み合わせ、 MUFGのDX活動に対するソリューションを提供します。 顧客・自社の ビジネス課題 ソリューション R&D ドメイン知識 人材交流による 金融DX人材育成・ DXナレッジ向上 MUFGとの協業・人材交流やR&D機能を通じて、金融のイノベーションを先導し、 MUFGのお客様にとっての金融体験や、MUFGの事業環境をアップデートし続けます。 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 4

5.

JDDの提供サービス AI・CX・Tech連携による ソリューション提供 + R&D 1. データを活かす 顧客データ、外部データを分析し、課題を解決するモデルを構築。 学術研究者や外部機関とも連携し、最新の技術を取り込むことを目指す。 AI 2. 顧客体験を創る 顧客を起点とする体験設計として、戦略立案、顧客調査、プロトタイピング、開発支援、 ブランディングまで一連のサービス、サポートを提供。 JDD 強み 3. 新しい技術で解決する データ分析モデル実装、アプリやウェブサイト、情報連携システムなどのプロトタイピング や実装サービス、コンサルティングを提供。 Tech CX CONFIDENTIAL© 2025 Japan Digital Design, Inc. 5

6.

業務端末 MacBook Pro – M4 Pro/Max メモリ48GB〜64GB USキーボードも選択可能 開発環境 GitHub Enterprise Cloud / GitHub Copilot が中心 Slack、Atlassian Cloud、AWS、管理系SaaS等にはSSOで接続可能 ネットワーク Webプロキシ無し・VPN無し・社内ネットワーク無し 勤務場所 リモート前提 ・フルフレックス CONFIDENTIAL© 2025 Japan Digital Design, Inc. 6

7.

1 Databricks Free Edition CONFIDENTIAL © 2025 Japan Digital Design, Inc. 7

8.

Free Editionとは • Databricksを無償で体験できるプラン • ノートブック、Serverless/Model Serving など主要機能の学 習・検証が可能 • 初学者の理解やPoC前の下見に最適 • 企業環境では制約が出やすいLLM関連機能も、個人環境で最新 機能に触れやすい Serverless Serving Genie Playground Assistant CONFIDENTIAL© 2025 Japan Digital Design, Inc. 8

9.

メールアドレス認証 または Google / Microsoft でサインアップ CONFIDENTIAL© 2025 Japan Digital Design, Inc. 9

10.

2 Genie CONFIDENTIAL © 2025 Japan Digital Design, Inc. 10

11.

AI/BI Genieスペースとは • 対象データ・用語定義・利用ルールをひとまとめにしたチャッ ト型分析スペース • 質問からSQLを自動生成して実行、表/グラフをその場で提示 • 根拠SQLの確認・共有、履歴やお気に入りで再現性を確保 • 権限はUnity Catalogに準拠、Serverless実行やモニタリングに も対応 • MCPにも対応! https://docs.databricks.com/aws/ja/genie/ CONFIDENTIAL© 2025 Japan Digital Design, Inc. 11

12.

3 モチベーション CONFIDENTIAL © 2025 Japan Digital Design, Inc. 12

13.

なぜGenieを触ろうと思ったか • Databricks に Text2SQL 機能(AI/BI Genie)が実装され、自 社でPoC中の領域と重なる実力を把握したかった • 自社スクラッチ版 Text2SQL と同条件で比較し、精度・再現 性・運用性の差を確認 • 比較結果に応じて移行も選択肢に入れ、最適な投資配分(内製 継続か/Genie活用か)を判断 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 13

14.

4 Genie主機能 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 14

15.

フィードバック • 生成した結果に対してユーザーがフィードバックを入力するこ とが可能 • 提供者はクエリの履歴一覧からフィードバック内容をモニタリ ングすることができ、Genieスペースのチューニングに活かせ る CONFIDENTIAL© 2025 Japan Digital Design, Inc. 15

16.

Instructions • Genieスペース単位でInstructionの指定が可能 • LLM実行時のコンテキストに入力される想定 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 16

17.

Conversation API • Genieスペースに対してAPI経由で問い合わせすることが可能 • MCP化も出来る CONFIDENTIAL© 2025 Japan Digital Design, Inc. 17

18.

5 自作NL2SQL vs Genie CONFIDENTIAL © 2025 Japan Digital Design, Inc. 18

19.

対象データセット No データソース 1 令和5年1月1日 住民基本台帳 人口・世帯数(都道府県別・総計) 2 2020年基準 消費者物価指数 3 令和3年 経済センサス‐活動調査 事業所に関する集計-産業別集計-卸売業・小売業(産 業編・総括表) 4 ドラッグストア 商品別販売額等 5 (家計調査)第3表 1世帯当たり年間の品目別支出金額(総世帯) 6 調剤医療費の動向 7 毎月勤労統計 概要 • 政府統計ポータル e-Stat の公開データを基に、検証用の擬似 テーブルを作成 • 作成したテーブルを入力として、自社 PoC の QA 生成エージェ ントで各テーブルにつき 15 問の QA を自動生成 Sample Dataset(住民基本台帳) • 自社の SQL Agent はテーブルごとにプロンプトを個別設計し ているため、Genie でも「1 テーブル=1 スペース」を作成し、 インストラクションにテーブル説明を登録 • API 経由で Genie を呼び出し、精度を評価 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 19

20.

結果 No データソース Genie 自社Agent Δ 1 令和5年1月1日 住民基本台帳 人口・世帯数(都道府 県別・総計) 0.4667 1.0000 +0.5333 2 2020年基準 消費者物価指数 0.7333 0.9333 +0.2000 3 令和3年 経済センサス‐活動調査 事業所に関する集計 -産業別集計-卸売業・小売業(産業編・総括表) 0.5714 0.7143 +0.1429 4 ドラッグストア 商品別販売額等 0.6667 0.8000 +0.1333 5 (家計調査)第3表 1世帯当たり年間の品目別支出金 額(総世帯) 0.6000 0.6667 +0.0667 6 調剤医療費の動向 0.8000 0.8000 0.0000 7 毎月勤労統計 0.3333 0.7333 +0.4000 • 評価方法:GoldenデータがText2SQLで取得したレコードに含 まれていれば正解と判定 • 結果比較:自社Agentの方がGenieより高い精度を示した • 誤り分析:Genieの出力をデバッグした結果、誤答の要因を特 定・推察 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 20

21.

6 差分考察 CONFIDENTIAL © 2025 Japan Digital Design, Inc. 21

22.

考察(邪推) • SQL生成前にサンプルデータを確認していない? • データが取得できなかった時に、テーブルの中身を見れてな い? • カラムやテーブルのディスクリプションを参照できてない? CONFIDENTIAL© 2025 Japan Digital Design, Inc. 22

23.

考察(邪推) • カラムのディスクリプションをLLMが把握できてない? • 現金給与総額 -> total_cash_earningsとColumn Commentに定 義済みだが別のカラムを取得する CONFIDENTIAL© 2025 Japan Digital Design, Inc. 23

24.

考察(邪推) • カラムのユニーク値を理解できてない? • 質問が繊維品卸売業に対して、実テーブル値は繊維・衣服等卸 売業 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 24

25.

• 列の説明関連 • 例示値 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 25

26.

JDDの情報発信について DS/MLE 積極採用中! 公式ブログ(note) https://note.com/japan_d2 公開記事 ● 金融の巨大データを活用した新しい価値の創造へ立ち向かう ● LLMを用いた合成データ作成事例をまとめてみた-NLP2024参加報告① ● テーブルデータ用ニューラルネットワークは勾配ブースティング木に どこまで迫れるのか? JDDコーポレートサイト https://japan-d2.com/ X(Twitter) https://x.com/Japan_D2 Facebook https://www.facebook.com/japand2 CONFIDENTIAL© 2025 Japan Digital Design, Inc. 26