【DeNA × AI Day】 LLMの事業適用を加速させるLLMOps

8.7K Views

February 05, 25

#dena ai day #LLMOps #MLOps #LLM #プロンプトエンジニアリング #RAG

スライド概要

DeNAでは近頃生成 AI の案件が次々と立ち上がっています。
データサイエンティストと共同で開発をしていく中でシステム的な課題が多く発生します。
システム的な品質を担保しつつ開発をドライブしていくためには、どのようなアプローチが有効でしょうか。
LLMOps というのが何なのか、また MLOps との違いは何なのか独断と偏見で解説していきます。

◆ チャンネル登録はこちら↓
https://www.youtube.com/c/denatech?sub_confirmation=1

◆ X(旧Twitter)
https://x.com/DeNAxAI_NEWS

◆ DeNA AI
https://dena.ai/

◆ DeNA Engineer Blog
https://engineering.dena.com/blog/

◆ DeNA × AI Day ‖ DeNA TechCon 2025 公式サイト
https://techcon2025.dena.dev/

DeNA_Tech

@DeNA_Tech

スライド一覧

DeNA が社会の技術向上に貢献するため、業務で得た知見を積極的に外部に発信する、DeNA 公式のアカウントです。DeNA エンジニアの登壇資料をお届けします。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

Roslynアナライザー_ Unityでの開発環境を改善するための静的解析の仕組みの構築

DeNA_Tech 64.6K

ディメンショナルモデルの実導入と実装について

DeNA_Tech 50K

Difyによる全社LLMプラットフォーム運用とv1アップデート

DeNA_Tech 38.3K

GraphQLやるならDataloaderを使おう

DeNA_Tech 33.7K

GitHub Actions x Unity プロジェクトの裏側

DeNA_Tech 29.7K

【DeNA TechCon 2025】 DeNAがマスタデータ管理にOyakataを使う理由

dena techcon 2025

DeNA_Tech 26.4K

各ページのテキスト

LLMの事業適⽤を加速させるLLMOps データ統括部データ基盤部外⼭寛 1 © DeNA Co., Ltd.

⾃⼰紹介外⼭寛 ● データ基盤部プラットフォームグループ所属 ● 2018年⼊社 ● MLOps=>データエンジニア=>LLMOpsと職種を転々としている 2 © DeNA Co., Ltd.

DeNAのLLMプロジェクトの特徴 DeNAでは多種多様な領域で事業を展開 LLMプロジェクトも様々な領域にわたり数多く存在 ※ スライドに記載している全てのサービスにおいてLLMの活⽤が⾏われているわけではありません 3 © DeNA Co., Ltd.

LLMOpsとは(⼀般論) ● 特に⼤規模⾔語モデルを使ったアプリケーションのオペレーションや管理など⼀連のプロセス ● 主要な要素には、モデルのデプロイメント、スケーラビリティの確保、パフォーマンスモニタリング、ログ管理、セキュリティ対策、プライバシー保護が含まれる 4 © DeNA Co., Ltd.

LLMOpsのスコープ(⼀般論) ● ● ● ● ● ● 5 デプロイメント(モデルの更新と管理) スケーラビリティモニタリングとロギングセキュリティとプライバシー効率化とコスト管理 ﬁne-tuningに伴う学習パイプラインの構築 © DeNA Co., Ltd.

DeNAの現状のLLMOpsのスコープ ● ● ● ● ● ● 6 デプロイメント(モデルの更新と管理) スケーラビリティモニタリングとロギングセキュリティとプライバシー効率化とコスト管理 ﬁne-tuningに伴う学習パイプラインの構築 © DeNA Co., Ltd.

スモールスタート ● 基本的にLLMプロジェクトの9割はスモールスタート ○ よってPoCから始まるので開発を少⼈数でいかに効率良く回せるかが重要となる ● 実装コスト上LLMで課題解決は以下のような優先順位で⾏う 1. プロンプトエンジニアリング 2. RAG 3. ﬁne-tuning 7 © DeNA Co., Ltd.

DeNAのLLMOps ● ⼀般的に話されるLLMOpsは⼤規模なプロジェクトでのﬁne-tuningを前提とした話が多い ● モデルをﬁne-tuningする話になるとMLOpsとあまり変わらない ● DeNAのLLMOpsは「PoCを⾼速に回す」ことがどちらかというと求められている ● プロジェクトにおいてLLM本当に価値が出せるかを⾒極めることが⼤事な場⾯が多いため 8 © DeNA Co., Ltd.

(DeNAの)LLMOpsとMLOpsの違い ● 学習パイプラインの構築が必須ではない ○ OpenAIやGeminiなどのモデルを使う場合は⾃社モデルのdeploy や管理の必要が基本ない ○ PoCはプロンプトエンジニアリングでなんとかなる ○ MLOpsの場合学習パイプラインの開発にかなり時間を取られるがこの点がない場合は運⽤的にも楽でスモールスタートしやすい ● 推論処理から先の開発フローは基本MLOpsと同じ ● 扱うライブラリの⼤半がLangChainやStreamlit関係 9 © DeNA Co., Ltd.

10.

LLMプロジェクトの進め⽅と役割(現状) データサイエンティストプロンプトエンジニアリング、各種モデル評価データサイエンティストプロジェクトにアサインされ、LLMモデルの評価やPOC実装、プロンプトエンジニアリングを⾏う LLMOpsエンジニア推論API開発(アプリ開発) プロジェクトにアサインされ、LLM システムの設計、実装、運⽤を担当 LLMOpsエンジニアインフラ構築 token消費量のモニタリング、インフラ構築などSREのような業務も担当運⽤プロジェクトによって担当領域は流動的 10 © DeNA Co., Ltd.

11.

LLM開発のフェーズ本開発確度が⾼いPoC フルスクラッチ開発 Streamlitなどのchat-UI Difyベースの社内基盤LLMアプリ (SAI) アイデア段階 11 © DeNA Co., Ltd.

12.

SAI ● 新卒研修から⽣まれた社内基盤LLMアプリ ● RAGを含む基本的なチャットアプリの作成‧利⽤をサポート ● LLMアプリ開発基盤OSS Difyをバックエンドに組み込み、⼊出⼒処理やRAG機能の開発を⾼速化 ● 全社運⽤にあたり、Google Cloud上に安定したDifyのインフラを構築 ○ TerraformコードをDeNAのOSSとしてGitHubで公開中 12 © DeNA Co., Ltd.

13.

LLMOpsのはじまり 13 © DeNA Co., Ltd.

14.

Azure OpenAI ● Azure OpenAI Serviceを社内で使いたい、がLLMOpsの始まりだった ● セキュリティ要件を満たしやすく、IaCなどインフラ管理との相性が良いAzure OpenAIに乗り換えたいという話が出た ● 最初はOpenAIのAPIを各⾃が⾃由に使っていた ○ ただwebブラウザでの利⽤は不可とするルールだった ● Azure OpenAIを使いたい⼈が部署内に多く出てきた ○ アカウントの運⽤が煩雑になり始めた ○ token消費量の最適な分散が必要になってきた 14 © DeNA Co., Ltd.

15.

Azure OpenAIのToken消費量の分散(例) region A(1000k tpm のcapacity) Endpoint(250k) Endpoint(250k) region B(500k tpm のcapacity) Endpoint(250k) Endpoint(250k) Endpoint(250k) Endpoint(250k) region C(300k tpm のcapacity) Endpoint(150k) Endpoint(150k) user単位で個別endpointを作成してcapacityを最適化 15 © DeNA Co., Ltd.

16.

各種LLM案件紹介 16 © DeNA Co., Ltd.

17.

⽬標設定サポートチャットAI ● ● ● 17 期初に⾏う⽬標設定をサポートしてくれるチャットAI 定性的な⽬標を定量化するように⾊々サジェストしてくれる社内900名以上が利⽤ © DeNA Co., Ltd.

18.

⽬標設定サポートチャットAI GCP VPC load balancing ● ● ● ● 18 Azure Cloud Run (streamlit) gpt-4o RAGなどは利⽤せずprompt engineeringで完結モデルはgpt-4oを使⽤ ○ gpt-4oは複雑なプロンプトエンジニアリングをしてもハルシネーションが発⽣しなかったフロントエンド、バックエンドはStreamlitで開発 GCPで動かすためCloud Runで稼働 © DeNA Co., Ltd.

19.

DeNAベイスターズ何でも相談チャットAI ● DeNAベイスターズの過去のニュースをRAGとして利⽤ ○ https://sp.baystars.co.jp/news/2024/12.php ● RAGのエンジンはpgvectorを使⽤(後述) ● モデルはgemini-1.5-proを使⽤ ○ これまではazureのgpt-4oが多かった ○ シンプルなpromptになった ● フロントエンド、バックエンドはStreamlitで開発 ● GCPで動かすためCloud Runで稼働 19 © DeNA Co., Ltd.

https://sp.baystars.co.jp/news/2024/12.php

20.

21.

DeNAベイスターズ何でも相談チャットAI GCP VPC cloud sql(pgvector) gemini 1.5 pro load balancing vector検索 private service connect cloud run 21 © DeNA Co., Ltd.

22.

対話AI‧データ基盤の開発 ● 内閣府の『戦略的イノベーション創造プログラム（SIP）』 ● ⼈とテクノロジーが共⽣‧協調して相互に⽀えあう社会を実現することを⽬指した対話AI‧データ基盤の開発 ● 現在開発中 ● 詳細はこちらに ○ https://www.nedo.go.jp/content/100979570.pdf 22 © DeNA Co., Ltd.

https://www.nedo.go.jp/content/100979570.pdf

23.

対話AI‧データ基盤の開発 AWS VPC Amazon Bedrock (claude 3.5 sonnet) Aurora(DB) Backend Server AI Server ● ● ● 23 VPC Endpoint アプリは全てaws上で構築 VPC Endpointを使ってセキュアにBedrockへ閉域接続 modelはbedrockでclaude 3.5 sonnetを使⽤ © DeNA Co., Ltd.

24.

25.

RAGとLangChain ● LangChainはLLMアプリ開発のライブラリ ○ 最早フレームワークと⾔えるレベルで機能が超⼤ ○ 主要なモデルはほぼ全てサポートしている ● 社内ではLLMアプリを開発する際にLangChainを使うことが多い ● RAGを使うにもLangChainから使えるRAGにする必要あり ● LangChainはRAGのサポートも⼿厚い 25 © DeNA Co., Ltd.

26.

pgvector ● ● ● ● 26 PostgreSQL の拡張機能（Extension）ベクトル型データを扱うことができるつまりRAG⽤途に使えるベクトル同⼠の距離⽐較（最近傍探索）の関数は以下 ○ L2 距離（ユークリッド距離） ○ 内積 ○ コサイン類似度（またはコサイン距離） © DeNA Co., Ltd.

27.

pgvectorのメリット ● PostgreSQL なのでCloudSQLやRDSなどで動かせる ○ AWSで動かそうがGCPで動かそうが差分がない ● LangChainから使いやすい ○ LangChainのサポートがしっかりしている ● pgvectorのdocker imageを使えばlocal開発もやりやすい ○ クラウド上と同じ構成の開発環境が実現できる ● RAGを要する場合⼤抵DBも必要になるので⼀⽯⼆⿃ ○ PoC向きでコストも抑えられる 27 © DeNA Co., Ltd.

28.

LLMプロジェクトにおけるのナレッジの集約 ● ● ● ● ● ● 28 メガプロンプトによる対話制御マルチエージェントシミュレーション LLM-as-a-Judgeによるマルチターン対話の評価 LangGraphによるワークフロー制御 Chain-of-Thought (CoT) による推論精度の改善 etc… © DeNA Co., Ltd.

29.

30.

課題. マルチクラウドのジレンマ ● なにかサービスを⽴ち上げる度にAzureとGCP、AzureとAWSを⽤意するのが結構な⼿間ではある ● 可能な限りGCPならGemini、AWSならBedrockと同じクラウド内で完結するようなサービス構成が運⽤しやすく、セキュリティ的にも堅牢である ● ただ、まだgpt-4oが使いやすいユースケースもある ● Azureで完結するような構成は今はない ○ 社内のケイパビリティの問題 30 © DeNA Co., Ltd.

31.

32.

まとめ ● LLMプロジェクトはまだまだこれからということもあり、スモールスタートさせたいというPoC案件が多い ● PoCをどうやって早く回すかというのもまたLLMOps ● PoCとはいえシステム的なベースは必要 ○ セキュリティとかも含む ○ システム構築部分をいかに⾼速に回すかが重要！ ○ LLMで本当に事業価値が出せるかを⾒極めることが重要 32 © DeNA Co., Ltd.