360 Views
January 27, 25
スライド概要
このウェビナーでは、HeatWave GenAI と HeatWave AutoML が AI と機械学習を統合することで、データ活用における新たな地平を開く方法を発見します。HeatWave GenAI が提供する大規模な言語モデルとコンテキストを理解した会話機能、および HeatWave AutoML による機械学習パイプラインの自動化が、どのようにしてデータ駆動型の意思決定を強化し、ビジネスに革命をもたらすかについて掘り下げていきます。
HeatWave GenAIの主な機能は?
HeatWave GenAIの主な機能は、データベース内の大規模言語モデル(LLM)、OCI生成AIとAmazon Bedrockとの統合、データベース内ベクトル・ストア、組み込みの自動生成、スケールアウト・ベクトルの処理、HeatWave Chatなどです。
HeatWave GenAIを利用できるクラウドは?
オラクルのHeatWave GenAIは、OCIとAmazon Web Services、Microsoft Azure、そして「OCI Dedicated Region」と「Oracle Alloy」を通じて顧客のデータセンター内で利用可能です。
---
※本ウェビナーのタイトル並びに上記のウェビナー概要やHeatWave GenAIの説明文は、HeatWaveのRAG (Retrieval-Augmented Generation / 検索拡張生成)を利用してHeatWave Chatにて生成した文章です。生成の際の実際の手順などもウェビナーにて解説しています。
日本オラクルにてMySQLをベースとしたHeatWaveの製品を担当するチームです。 ウェビナーやイベント情報はMySQLの公式ブログ日本語版に掲載しています。 https://blogs.oracle.com/mysql-jp/post/heatwave-events-in-japan
AIと機械学習の融合: HeatWave GenAIと HeatWave AutoMLがもたらすデータ活⽤の進化 梶⼭ 隆輔 / KAJIYAMA, Ryusuke ⽇本オラクル株式会社 Technology Business Development Director Open Source Data Platforms
多様なデータ活⽤の要件と課題 ECサイトを例に リアルタイムでの売上や⾏動分析 お客様ごとの「おすすめ」の提供 RDBMSのテーブルに蓄積された 履歴データに対する 複雑なSELECT⽂の実⾏ お客様の購買履歴や 属性情報に対する 機械学習でのレコメンデーション レビューの感情分析や要約 ⽣成AIを利⽤して 書き⼿の感情の分析や 複数のレビューを要約 異なるシステムやサービス間でのデータのやりとりが発⽣ ⽣成AI データベース 機械学習 2 Copyright © 2025, Oracle and/or its affiliates
Transactional Analytics Lakehouse AutoML GenAI クラウド版MySQL Enterprise Edition ⼤規模データ分析を ⼤幅に⾼速化 オブジェクト・ ストレージとの統合 機械学習の パイプラインを⾃動化 専⾨知識なしで ⽣成AIの活⽤ 3 Copyright © 2025, Oracle and/or its affiliates
顧客事例︓NVIDIA ミッションクリティカルなエンジニアリングのアプリケーションが稼働するMySQLをクラウド化 • MySQLを利⽤するエンジニアリングの アプリケーションは世界各地の複数拠点に分散配置 • チップの設計や製造に関連するシステムのため ビジネスへの影響が⼤きく⾼い可⽤性が要求される クラウドへの移⾏後のビジネス⾯での効果 全世界での MySQLの展開 • 新しいデータベース基盤を⽶国から NVIDIAの世界各地の拠点に展開 • ⼀部のアプリケーションは既存のデータセンターで 稼働するためFastConnectで各地のOCIと接続 アプリとDBの コロケーション • アプリケーションとデータベースの間の 通信遅延を削減 HeatWave MySQLの本番環境 GPUやHPCへの OCI利⽤拡⼤ • 当初想定のクラウド活⽤の領域から より多様なワークロードに展開 コスト最適化 • 適切な規模のアーキテクチャ、⼀連のDevOpsの ⾃動化、 データの保護とバックアップのポリシー HeatWave AutoMLを使⽤し、 MySQLサーバーの稼働ログから課題を早期発⾒ →拡張を必要とするリソースの発⾒から プロビジョニングまでの流れを迅速化 4 Copyright © 2025, Oracle and/or its affiliates
クラウド版MySQLサーバーとしてのHeatWave MySQL 業界“唯⼀” のEnterprise版によるフルマネージド型のMySQLサービス • シンプルかつ安価な価格体系 • MySQLのスレッドプールによる⾼い性能拡張性 • MySQLの開発元が提供するサポートサービス • マルチAZ/FDに分散配置した⾼可⽤性 • リードレプリカによる参照処理性能向上 HeatWave MySQLとAmazon Auroraの性能拡張性⽐較 スループット (txn/s) 6000 4000 10倍以上 ⾼速 2000 0 5 ー HeatWave MySQL ー Amazon Aurora 1 4 16 64 128 256 512 1024 2048 4096 同時実⾏トランザクション Copyright © 2025, Oracle and/or its affiliates コスト⽐較 200GBのストレージ利⽤時 • HeatWave MySQL:約1,200ドル/⽉, 4ノード構成 • Amazon Aurora: 約2,200ドル/⽉, 2ノード構成 ※ 8 vCPU, メモリ 64GB, 200GBストレージ ⾼可⽤性構成および参照処理⽤ノードあり +α • AutoPilotによるインデックス・アドバイザや スレッドプール・アドバイザによる性能向上 • クエリ・アクセラレータのHeatWaveエンジンの 追加で⼤幅な分析処理性能の向上可能 • DB内データに対する機械学習処理も HeatWaveエンジン追加で対応可能 オラクルのMySQL開発チームが提供する 安価かつ⾼性能なクラウド版MySQL
顧客事例︓NTTソルマーレ 様 HeatWaveで国内最⼤級の電⼦書籍配信サービス「コミックシーモア」でのデータ利活⽤を強化 利⽤サービス・製品 • HeatWave お客様のコメント 「『HeatWave』の導⼊によりサービス基盤とデータ分析基盤の リアルタイムなデータ同期が実現できました。さらにこれまで 通常のMySQLで1.5時間程度かかっていたバッチ処理が2秒程 度で完了するなど性能の良さも実感しています。 処理を待つ思考 停⽌の時間が短縮化され、業務効率化にもつながっています。 システム構成イメージ MySQLに対応したツールは『HeatWave』でもそのまま活⽤でき、 ユーザーの利便性を維持しながら様々な分析データを 更なるサービス向上に役⽴てることができています。 『HeatWave』を利⽤した新たなデータ分析基盤を活⽤し、 今後も更に幅広いお客様に楽しんでいただける 書籍配信サービスを提供していきます。」 レプリケーション リアルタイム同期 コミックシーモアの サービス基盤 6 Copyright © 2025, Oracle and/or its affiliates HeatWaveによる データ分析基盤 エヌ・ティ・ティ・ソルマーレ株式会社 電⼦書籍事業部 サービス開発グループ ⽊下 ⽒
HeatWaveクラスターのアーキテクチャ MySQLのInnoDBのテーブルに追加されたデータは分析クエリで即座に利⽤可能 • アプリケーション側からはMySQLに対してSQLを実⾏するのと同じ Insert/ Update 分析 クエリ 結果 セット 並列化 MySQL Database Service HeatWave Node MySQL コンパイラ & オプティマイザー OLTPクエリ 最適化 MySQL クエリ実⾏ 分析ジョブスケジューラ 分析クエリ 最適化 InnoDB ストレージエンジン 結果 7 Copyright © 2025, Oracle and/or its affiliates クエリ プッシュダウン 分析クエリ実⾏ インメモリデータ管理 リアルタイム 更新 リロード Object Storage
HeatWave Lakehouse オブジェクト・ストレージ内の様々な形式のデータを500TBまでクエリ実⾏ 8 Copyright © 2025, Oracle and/or its affiliates • 標準のSQL構⽂でMySQLデータベース内、 オブジェクト・ストレージ内、または その両⽅のデータに対するクエリ処理 • データは最⼤500TBまで、HeatWave クラスターは最⼤512ノードまで拡張可能 • オブジェクト・ストレージ内データへのクエリ処理は データベース内データへの処理と同様に⾼速 (業界初!) • オブジェクト・ストレージ内データはHeatWave クラスターにロードされ、MySQLデータベースへの コピーは⾏われない
AWS&AzureユーザーもHeatWave を使⽤可能 マルチクラウド利⽤にも対応 OCI On-Premises Azure AWS Oracle Cloud Infrastructure User Tenancy OCI AWS Availability Domain Customer Data Center VCN Subnet A Transaction Processing Analytics Identity VPN Dynamic Routing Gateway Customer AWS Tenancy MySQL HeatWave Bastian Server Virtual Machine Autopilot Machine Learning Data Console Control Plane Data Plane Subnet B Billing 8.0.31 MySQL Database Service Heatwave • OCIのハイパフォーマンスインフラに 最適化されたMySQL • セキュリティ、ネットワークなどOCIに 統合されたサービス • OCI全リージョンで提供 9 HeatWave Copyright © 2025, Oracle and/or its affiliates • OCIのリソース上にデプロイ • Azure-OCI間のネットワーク 設定が不要 • OCIとAzure間のデータ転送費 およびポート費⽤が無料 • AWS上のリソースを 利⽤してデプロイ • エグレス・コストや コンプライアンス上の懸念を解決 • インタラクティブなSQL実⾏や 機械学習など独⾃のコンソール Applications
HeatWave AutoML 機械学習の⾃動化 10 Copyright © 2025, Oracle and/or its affiliates
MySQLの機械学習プラットフォーム HeatWave AutoML 機械学習をより⼿軽に安全に 活⽤できるプラットフォーム 実業務に活⽤できる 説明可能性をサポート ⾼性能・⾼精度なモデル⽣成を 誰でも実⾏できるインタフェース ü 追加料⾦不要ですぐに利⽤可能 ü Oracle AutoMLにより、 機械学習⼯程を⾃動化 ü HeatWave上で完結でき、外部 にデータを出さずに実⾏可能 ü ブラックボックス化しやすい推論の 説明を明確化 ü 特徴量が予測に与える影響を ⾃動で判断 ü 法令遵守、公平性などの観点から モデルの挙動、有効性を⾒極め ü 各⼯程に対応した関数を実⾏ するだけで予測まで実⾏可能 ü パラメータ、アルゴリズムの選択など 専⾨的な知識は不要 ü トレーニングの⾼速化により、 迅速なモデル⽣成を⽀援 展開 予測 クエリ HeatWave ML ⽣成モデル 11 Copyright © 2025, Oracle and/or its affiliates 説明
HeatWave AutoMLでの機械学習の種類と想定利⽤者 • ユースケース: • 分類 (Classification): ⼊⼒されたデータがどのカテゴリに⼊るかを予測 • 回帰 (Regression): 連続したデータがを元に次の値を予測 • 時系列予測 (Time Series Forecasting): 将来における傾向を予測 • 異常検知 (Anomaly Detection): ⼊⼒されたデータが特異なデータかを予測 • レコメンデーション・システム (Recommender System): ⼊⼒されたデータから推奨される値のセットを予測 • トピック・モデリング (Topic Modeling): テキストを特徴付ける語群や表現を抽出 ※現時点では英語のみ対応 • 想定利⽤者: • データベース利⽤者: 使い慣れたMySQLのSQL⽂から簡単に各処理を実⾏可能 • データ・サイエンティスト: モデルの訓練から精度の⾼い予測、説明までの⼀連の作業を⾃動化により効率化 12 Copyright © 2025, Oracle and/or its affiliates
HeatWave AutoMLは幅広い⽤途に適合 データベース内データもオブジェクト・ストレージ内データも 異常検知 分類 データベースの データ クレジットカードの 不正使⽤検知 時系列予測 広告費⽤のROI予測 悪意のある ゲームハッカーの特定 類似したユーザーの特定 おすすめの動画 債務不履⾏ の予想 13 Copyright © 2025, Oracle and/or its affiliates オブジェクト・ストレージの データ Database exports 需要予測 フライト遅延の予測 降⾬予報 レコメンド・システム NEW 回帰
HeatWave AutoMLで機械学習のライフサイクルを⾃動化 モデル⽣成のプロセス データセット ⾼速なトレーニングを提供 データの前処理 アルゴリズムの選択 • 繰り返し作業不要 • ⾼度に並列化されたハイパーパラーメーターの チューニング技法 • 正確性を維持しながら⾏う インテリジェントなサンプリング • ⾃動的に収束するトレーニング • クラスターのサイズに応じて性能がスケール アダプティブなサンプリング 特徴量の選択 ハイパーパラーメーターのチューニング モデルの説明 予測の説明 ベンチマーク結果を以下で公開中 チューニングされたモデル 14 Copyright © 2025, Oracle and/or its affiliates https://www.oracle.com/mysql/heatwave/performance/
HeatWave AutoMLでの機械学習処理の流れ シンプルなSQL関数と学習処理の⾃動化 MySQL呼び出し 学習データ展開 ML_TRAIN モデルのロード ML_MODEL_LOAD モデル作成 HeatWave Cluster 保存 モデルカタログ ML_PREDICT_* 推論 学習データやテストデータはMySQLサーバー上のテーブルとして管理 ML_EXPLAIN_* 説明(特徴量の抽出) アプリケーションからはHeatWave MLが⽤意したSQL関数群を実⾏ https://dev.mysql.com/doc/heatwave/en/heatwave-machine-learning.html ML_SCORE 15 モデルの検証 Copyright © 2025, Oracle and/or its affiliates
HeatWave: Native machine learning capability HeatWave AutoML Neither data nor model leaves MySQL HeatWave 従来の⽅法との⽐較 Sensitive Model/Data Boundary HeatWave: Native machine learning capability Neither data nor model leaves MySQL HeatWave Traditional way to run ML on 従来の⽅法でMySQLデータに対する MySQL data 機械学習処理を⾏う場合 Traditional way to run ML on Sensitive Model/Data Boundary MySQL data Train model request ML application request Pull ML Training data ML Model Trained Model Inference request Inference request ML Model ML ML Inference InferencePull data SQL ML ML Explanation Explanation 8 16 8 Copyright © 2021, Oracle and/or its affiliates | Confidential: Internal Copyright © 2021, Oracle and/or its affiliates | Confidential: Internal Copyright © 2025, Oracle and/or its affiliates Train model SQL Train Trainmodel model Inference Inference SQL Inference Pull data ML Training MySQLHeatWave HeatWave ML Training HeatWave Compute SQL SQL Trained Model HeatWave ML Compute MySQL Database Pull data Sensitive Model/Data Boundary MySQL HeatWave HeatWave AutoML Sensitive Model/Data Boundary MySQL ML application Database Train modelML Training HeatWave ML SQL Inference/ Explanation Train MySQL Client MySQL Inference/ Explanation Train Client Trained Trained Model Model ML Inference ML Inference ML ML Explanation Explanation MySQL MySQL
HeatWave AutoMLの説明可能性 モデルと予測の「説明」 • モデルの「説明」 • モデルの訓練時に説明に必要な情報 をあわせて作成 • モデルの最も重要な特徴量を判別 • 評価⼿法︓Shap, Fast Shap, Permutation Importance, 部分依存グラフ • 予測の「説明」 • 特定の⾏またはテーブル全体に対する 重要度の⾼い特徴量を判別 • Shap, Permutation Importance 17 Copyright © 2025, Oracle and/or its affiliates
HeatWave GenAI ⽣成AI & Vector Store 18 Copyright © 2025, Oracle and/or its affiliates
HeatWave GenAIは新しいユースケースおよびアプリケーションを実現可能に + ⾃然⾔語での会話 コンテンツの生成と要約 RAGおよび 類似性検索 統合された⽣成AIと 機械学習の相乗効果 • ⾮構造化ドキュメントの 内容をベースとした ⾃然⾔語による会話 • 企業や組織内のドキュメント からインサイト/レポートを⽣成 • 組織内のデータ(RAG / Retrieval Augmented Generation)を使⽤し、 より正確で状況に即した 回答を提供 • 機械学習と⽣成AIを 組み合わせ、時間を節約し、 より多くの価値を顧客に提供 • HeatWaveチャットは フォローアップ質問の コンテキストを保持 19 Copyright © 2025, Oracle and/or its affiliates • PDF形式のマニュアルから ブログを⽣成 • コンテンツの要約 • ⾮構造化データに対する 類似性検索の実⾏ • AutoMLでフィルタされた データで⽣成AIを使⽤する ことで、コストを削減し、 より正確な結果を迅速に 取得可能
HeatWave GenAIにおける各コンポーネントの役割 SQLインターフェース ⾼速処理基盤 RAG基盤 機械学習エンジン LLMとの連携 VECTORデータ型 最⼤512ノードまでの スケール・アウト構成 ⾮構造データの活⽤ 機械学習と⽣成AIを 組み合わせたアプリの 開発を効率化 HeatWaveに 組み込まれた「イン・ データベースLLM」 ベクトル関数 JavaScript ストアド・プロシージャ 20 インメモリ・データストア Copyright © 2025, Oracle and/or its affiliates ⼤量データ対応 OCIの⽣成AIサービスと の連携も可能
ベクトル(VECTOR)データ型と関数 MySQL 9.0 Innovation Release ベクトルの類似度を演算するHeatWaveのみで利⽤可能なDISTANCE関数 • 2つのベクトルを引数とする • 第3引数には距離の演算⽅法を指定 COSINE, DOT, EUCLIDEAN mysql> SELECT DISTANCE(STRING_TO_VECTOR("[1.01231, 2.0123123, 3.0123123, 4.01231231]"), STRING_TO_VECTOR("[1, 2, 3, 4]"), "COSINE"); +-----------------------------------------------------------------------------------------------------------------------+ | DISTANCE(STRING_TO_VECTOR("[1.01231, 2.0123123, 3.0123123, 4.01231231]"), STRING_TO_VECTOR("[1, 2, 3, 4]"), "COSINE") | +-----------------------------------------------------------------------------------------------------------------------+ | 0.0000016689300537109375 | +-----------------------------------------------------------------------------------------------------------------------+ ベクトルと⽂字列の相互の変換関数 mysql> SELECT STRING_TO_VECTOR("[1.05, -17.8, 32]"); +---------------------------------------+ | STRING_TO_VECTOR("[1.05, -17.8, 32]") | +---------------------------------------+ | 0x6666863F66668EC100000042 | +---------------------------------------+ 1 row in set (0.00 sec) mysql> SELECT VECTOR_TO_STRING(0x00000040000040400000A0400000E040); +------------------------------------------------------+ | VECTOR_TO_STRING(0x00000040000040400000A0400000E040) | +------------------------------------------------------+ | [2.00000e+00,3.00000e+00,5.00000e+00,7.00000e+00] | +------------------------------------------------------+ 1 row in set (0.00 sec) 21 Copyright © 2025, Oracle and/or its affiliates
JavaScriptストアドプログラムのサポート
MySQL 9.0 Innovation Release
SQLでのストアドプログラムと同様に作成可能
mysql> CREATE FUNCTION gcd(a INT, b INT)
-> RETURNS INT NO SQL LANGUAGE JAVASCRIPT AS
-> $mle$
$>
let x = Math.abs(a)
$>
let y = Math.abs(b)
$>
while(y) {
$>
var t = y
$>
y = x % y
$>
x = t
$>
}
$>
return x
$> $mle$
-> ;
Query OK, 0 rows affected (0.01 sec)
利⽤もSQLでのストアドプログラムと同様
mysql> SELECT gcd(75, 220), gcd(75, 225);
+--------------+--------------+
| gcd(75, 220) | gcd(75, 225) |
+--------------+--------------+
|
5 |
75 |
+--------------+--------------+
1 row in set (0.00 sec)
22
Copyright © 2025, Oracle and/or its affiliates
• ⾔語仕様はECMAScript 2023 Specificationに
準拠し、標準のライブラリ・オブジェクトをサポート
Object, Function, Math, Date, String
• ストアドプログラムの引数や戻り値として
MySQLのデータ型をサポート ※VECTOR型を除く
• SQL⽂の実⾏結果をJavaScript内で利⽤可能
27.3.6 JavaScript SQL API
• 主な制限事項
• Globalオブジェクトはサポートされているが、
スコープは各ストアドプログラム内に限定される
• ファイルやネットワークへのアクセスは不可
• サードパーティーのライブラリのインポートは不可
• シングルスレッドでの処理
• 関数の再帰呼び出しは1,000回まで
イン・データベースLLMはHeatWaveノードに分散して実⾏ Execution time (s) 10000 9358 8000 • ⽣成AIのクエリは複数のノードに 分散して並列実⾏ 6000 • 他のクエリに影響を与えずに 各ノードでクエリを実⾏ 4947 • 32ノードで22倍の性能向上 4000 2433 2000 1276 695 0 1 2 4 8 #HeatWave nodes 23 Copyright © 2025, Oracle and/or its affiliates 16 423 32
イン・データベースLLMとデータベース内埋込みの⽣成 OCI⽣成AIサービスとも統合 アプリケーション オブジェクト・ストア 埋込み⽣成 ⾃然⾔語の質問 ベクトル・ストア HeatWave チャット HeatWave AutoML 拡張 プロンプト ⾃然⾔語応答 イン・データ ベースLLM HeatWave 24 Copyright © 2025, Oracle and/or its affiliates トレーニング済 モデル
ユースケース1: パーソナライズされた推奨事項 オブジェクト・ストレージ 「今⽇のおすすめの ベジタリアン向け料理はなに︖」 メニュー 質問 ユーザー 解答 25 「おすすめの料理は次の通りです。 ⾖腐カレー、⾖腐ビリヤニ、 ひよこ⾖のカレー」 HeatWave ベクトル・ストア ユーザーが質問を⼊⼒ HeatWave AutoMLのレコメンデーション・システムが ユーザーの注⽂履歴を元にレストランを提案 LLMがパーソナライズされたおすすめ料理を ⾃然⾔語で回答 ベクトル・ストアに格納されている提案されたレストランの メニューからおすすめの料理を選択 Copyright © 2025, Oracle and/or its affiliates メニュー メニュー
ユースケース2: 予測メンテナンス 質問 「このログの主な問題点はなに︖ 2つの⽂章にまとめて」 本番環境 オブジェクト・ストレージ ログ 問題と対策のナレッジベースのログ 本番環境のログがリアルタイムで HeatWave AutoMLの処理対象となる HeatWaveベクトルストア経由でLLMが ナレッジベースのデータにアクセスできる ユーザー 解答 「このログにおける主な問題は 特定のプロセス(ID 8145)による メモリ使⽤量があらかじめ定義された 閾値を継続的に超過していることです」 ユーザーが質問を⼊⼒ ⾃然⾔語での回答を得る 26 Copyright © 2025, Oracle and/or its affiliates HeatWave ベクトル・ストア HeatWave AutoMLがログから異常を検出しフィルタリング ベクトルストアがログの異常に関するコンテキストを追加し、 LLMに対するプロンプトに情報を追加する LLMが情報が追加されたプロンプト(Augmented Prompt)を元にレポートを⽣成
MySQL HeatWaveの⽣成AIの活⽤例: ログの集約と異常検出 AutoMLと⽣成AIのシナジー Report Generation: Summarization of anomalous logs Ask the question (‘What is the main problem in the following collection of logs. Provide a two-sentence summary.’) “The main problem in this collection of logs is that the memory usage of a particular process (with ID 8145) is consistently exceeding the defined memory threshold. This issue is repeatedly highlighted in the logs, and SIGTERM signals are sent to the main thread to terminate the process when it exceeds the memory threshold. Would you like me to help you with anything else regarding this collection of logs?" 27 Copyright © 2025, Oracle and/or its affiliates
HeatWave GenAIデモ - ECサイトの商品レビューの要約
⽇本語データのLLM別の要約の差およびデータ追加による要約の変化
1. ⽇本語でのポジティブなレビューだけが
50件⼊っているテーブルを作成
2. 3種類のLLMを使ってそれぞれ要約を⽣成
• OCI⽣成AIサービスのcohere.command-r-plus
• OCI⽣成AIサービスのcohere.command-r-16k
• イン・データベースLLMのllama3-8b-instruct-v1
→ ストアド・プロシージャの中でHeatWave GenAIの
JavaScript APIのml.generate()に
プロンプトやモデル名を渡している
3. ネガティブなレビューを30件強追加
4. 再度cohere.command-r-16kで要約を
⽣成するとネガティブな内容も含まれる
28
Copyright © 2025, Oracle and/or its affiliates
CREATE PROCEDURE SUMMARIZATION_JA(
IN str_model_id VARCHAR(32),
IN str_language VARCHAR(64),
OUT processed_summary TEXT
) LANGUAGE JAVASCRIPT AS $$
let sql = session.prepare("SELECT review_text
FROM reviews_ja");
let reviews = sql.execute();
let all_reviews = Array.from(reviews).map(review
=> review.review_text).join("¥n");
let prompt = `Write a concise summary of the
text in Japanese: ${all_reviews}`;
let summary = ml.generate(prompt, {model_id:
str_model_id, language:str_language});
processed_summary = summary.trim();
$$;
イン・データベースLLMとデータベース内埋込みの⽣成 OCI⽣成AIサービスとも統合 アプリケーション オブジェクト・ストア 埋込み⽣成 ⾃然⾔語の質問 ベクトル・ストア HeatWave チャット HeatWave AutoML 拡張 プロンプト ⾃然⾔語応答 イン・データ ベースLLM HeatWave 30 Copyright © 2025, Oracle and/or its affiliates トレーニング済 モデル
HeatWaveが解決する多様なデータ活⽤の課題 ECサイトを例に リアルタイムでの売上や⾏動分析 お客様ごとの「おすすめ」の提供 RDBMSのテーブルに蓄積された 履歴データに対する 複雑なSELECT⽂の実⾏ お客様の購買履歴や 属性情報に対する 機械学習でのレコメンデーション レビューの感情分析や要約 ⽣成AIを利⽤して 書き⼿の感情の分析や 複数のレビューを要約 異なるシステムやサービス間でのデータのやりとりが発⽣ ⽣成AI データベース 機械学習 31 Copyright © 2025, Oracle and/or its affiliates
HeatWaveが解決する多様なデータ活⽤の課題 ECサイトを例に リアルタイムでの売上や⾏動分析 お客様ごとの「おすすめ」の提供 RDBMSのテーブルに蓄積された 履歴データに対する 複雑なSELECT⽂の実⾏ お客様の購買履歴や 属性情報に対する 機械学習でのレコメンデーション レビューの感情分析や要約 ⽣成AIを利⽤して 書き⼿の感情の分析や 複数のレビューを要約 データを移動せずに⼀つのクラウド・サービス内で処理可能 ⽣成AI データベース 機械学習 32 Copyright © 2025, Oracle and/or its affiliates
HeatWaveによりセキュリティが強固に HeatWave その他のサービス レイクハウス 機械学習 LLM ユーザ・ データ アプリ 分析 OLTP HeatWave ベクター ストア • データが広範囲にわたって移動 • データは1つのデータベース・システムで管理される • 暗号化鍵、ユーザー・アクセス、認証スキームなど、 異なるセキュリティ特性を持つ複数のサービス • 統⼀的なアクセス制御と単⼀の構成 • すべての通信が認証され暗号化 • 33 ユーザーが複数のサービスを構成し、接続する必要がある Copyright © 2025, Oracle and/or its affiliates
MySQL Shell for VS Code - HeatWave Chat HeatWave Chat ⾃然⾔語を使って⽂書と対話。 ⽂脈が保持され、フォローアップの質問に よる会話を可能にする Lakehouse Navigator LLM がデータベース、HeatWave Lakehouse, HeatWave Vector Store 全体または 特定のデータ・セットから情報を取得できるように ガイドし、速度と精度を向上させる グローバル検索と詳細検索 全てのベクトル・ストアを検索することも、 特定のスキーマに検索範囲を限定することも可能 34 Copyright © 2025, Oracle and/or its affiliates
MySQL Shell for VS Code - Lakehouse Navigator RAGのためのドキュメント・ファイルのアップロードとベクトル埋め込みの⽣成 • OCIのプロファイルを⽤意しておくと オブジェクト・ストレージのバケットの⼀覧が表⽰される • アップロードするドキュメントと対象のバケットを選択 35 Copyright © 2025, Oracle and/or its affiliates • ベクトル埋め込みを格納するテーブル名を指定 • 対象のテーブルはHeatWaveクラスターに ⾃動的にロードされる • アップロードする対象のファイル形式を選択 ⾃動判別も可能
MySQL Shell for VS Code - Lakehouse Navigator RAGのためのベクトル埋め込みの⽣成 mysqlsh > DESC `RAG_test`.`HeatWave_ja_doc`; +-------------------+---------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------------------+---------------+------+-----+---------+-------+ | document_name | varchar(1024) | NO | | NULL | | | metadata | json | NO | | NULL | | | document_id | int unsigned | NO | PRI | NULL | | | segment_number | int unsigned | NO | PRI | NULL | | | segment | varchar(1024) | NO | | NULL | | | segment_embedding | vector(384) | NO | | NULL | | +-------------------+---------------+------+-----+---------+-------+ • ベクトル埋め込みが格納されているテーブルの定義 • アップロードされたドキュメントのメタデータや ドキュメントを分割したセグメントの ベクトル埋め込みを格納 • ベクトル埋め込みの⽣成の進捗が表⽰される • ロード済みドキュメントの再ロードやアンロードも可能 36 Copyright © 2025, Oracle and/or its affiliates
RAGテーブルの例
HeatWaveのイン・データベースLLMが⽣成したベクトル埋め込みの格納先
• 各⾏にドキュメントの⼀部である
セグメント単位でのベクトル埋め込みを格納
• 格納されている情報
• ドキュメントがアップロードされたバケットのURL
• ドキュメントのメタデータ
• セグメントの⽂字列
• セグメントのベクトル埋め込み
※画⾯右の例はVECTOR_TO_STRING()関数で
VECTORデータ型の値を⽂字列に変換
• ML_EMBED_TABLE()ストアド・プロシージャ
• セグメントの⽂字列が格納された列から
ベクトル埋め込みを⽣成し別の列に格納可能
37
Copyright © 2025, Oracle and/or its affiliates
document_name: https://objectstorage.us-chicago1.oraclecloud.com/n/idazzjlcjqzj/b/bucket-202411251945/o/HeatWave_PR.docx
metadata: {
"TITLE": "",
"SOURCE": "Microsoft Office Word",
"COMPANY": "",
"KEYWORD": "",
"SUBJECT": "",
<略>
"LASTSAVEDBY": "Ryusuke Kajiyama",
"CREATIONDATE": " 11/25/2024 14:56:00",
"LASTSAVEDATE": "11/25/2024 14:58:00",
"PRIMARYAUTHOR": "Ryusuke Kajiyama",
"REVISIONNUMBER": "2",
"USERDEFINEDPROP": "MSIP_Label_3c76ce46-357f-46de-88d677b9bbb83c46_ContentBits 0",
"COUNTCHARSWITHSPACES": "5849"
}
segment: ベクトル・ストアの作成とベクトル処理のベンチマーク
PDF、PPT、WORD、HTML形式のドキュメントのベクトル・ストアの作成は、Amazon BedrockのKnowledge
baseを使⽤する場合と⽐較して、HeatWave GenAIを使⽤すると最⼤23倍速く、コストは4分の1になります。
1.6GBから300GBのサイズのテーブルに対する様々な類似検索クエリを使⽤したサードパーティ・ベンチマークで実
証されたように、HeatWave GenAIはSnowflakeより30倍⾼速でコストは25%削減され、Databricksよ
り15倍⾼速でコストは85%削減され、Google BigQueryより18倍⾼速でコストは60%削減されます。
embedding: [1.00200e-02,-9.13479e-03,-3.69700e-02,-1.06737e02,2.55649e-02,-5.62598e-02,3.64135e-02,7.52265e-02,3.79956e-02,1.37684e-02,4.32041e-02,7.74046e-03,7.84678e-02,3.38508e-02,-1.98059e02,6.20408e-02,3.44924e-02,-5.85962e-02,-4.80669e-02,-2.94210e02,2.18502e-02,-1.33754e-02,-6.01970e-02,2.98551e-02,5.98533e02,7.20425e-02,-2.66657e-02,2.48639e-02,3.74166e-02,-4.72570e-02,5.92472e-02,-6.74163e-02,8.72355e-02,-4.54183e-02,6.70901e-02,9.89798e03,-1.70986e-02,-3.06104e-03,6.57276e-02,-9.53107e-02,-5.37361e02,2.24137e-02,1.84493e-02,5.42278e-02,4.01875e-03,8.33606e-02,-6.25437e03,8.57158e-02,-7.97270e-02,1.60378e-02,2.08244e-02,8.79194e-02, <略>
HeatWave Chat RAGを活⽤して⾃然⾔語でドキュメントを検索 • チャットの履歴が保存され、 追加の質問でのコンテキスト (⽂脈)として利⽤される • RAGとして利⽤する スキーマを選択可能 • 該当するドキュメントの 情報を表⽰ • 利⽤するLLMおよび⾔語を 選択可能 38 Copyright © 2025, Oracle and/or its affiliates
RAGの有無での精度の違い - 「HeatWave GenAIの主な機能は︖」への回答 モデル: cohere.command-r-plus, オプションの設定はなし RAGなしの場合 RAGありの場合 HeatWave GenAIは、Oracle Autonomous Databaseの主要なコンポーネントであり、機械学習 ワークロードを⾼速化するために設計されています。その 主な機能は、機械学習アルゴリムの⾼速処理と、デー タベース クエリのリアルタイム処理を可能にする、イン メ モリー処理です。 HeatWave GenAIの主な機能は、データベース内の ⼤規模⾔語モデル(LLM)、OCI⽣成AIと Amazon Bedrockとの統合、データベース内ベクト ル・ストア、組み込みの⾃動⽣成、スケールアウト・ベ クトルの処理などです。 → そもそもの製品としての情報が誤っているほか、 OCIでのcohere.command-r-plusは HeatWave GenAIリリース前の2024年6⽉に 提供開始となっているため情報が不⾜している HeatWave GenAIの⽇本語プレスリリース、 製品ページ(oracle.com/jp/heatwave/genai/)の 機能⼀覧とよくある質問、およびプレゼンテーションを 情報源として追加 → 今回のケースでは、上記のうち機能⼀覧とプレスリリー スを利⽤し回答を⽣成 39 Copyright © 2025, Oracle and/or its affiliates
HeatWave GenAIのRAG利⽤ したHeatWave Chatで⽣成した セミナー案内 RAGを利⽤しないと精度の低い情報が列挙されていたが、 サービスに関するホワイトペーパーやプレゼンテーションを オブジェクト・ストレージに載せてHeatWaveに読み込ませる ことで正確な⽂章の⽣成に成功 40 Copyright © 2025, Oracle and/or its affiliates
Transactional Analytics Lakehouse AutoML GenAI クラウド版MySQL Enterprise Edition ⼤規模データ分析を ⼤幅に⾼速化 オブジェクト・ ストレージとの統合 機械学習の パイプラインを⾃動化 専⾨知識なしで ⽣成AIの活⽤ 41 Copyright © 2025, Oracle and/or its affiliates
OCIのAlways Free Servicesで無料でHeatWaveを利⽤可能 https://www.oracle.com/jp/heatwave/free/ • Oracle Autonomous Transaction Processing, Autonomous Data Warehouseと同じく、 HeatWaveも期間の制限なく無料で使⽤可能 • ベクトル・ストアの作成やベクトル関数を使⽤した セマンティック検索も可能 • インスタンス数や容量、⼀部機能の制限あり • 容量制限などがない30⽇間無料トライアルとして 300ドルの無料クレジットをあわせて提供 • HeatWave GenAIの試⽤はトライアルにて 42 Copyright © 2025, Oracle and/or its affiliates
43 Copyright © 2025, Oracle and/or its affiliates