AWSで実現するLLMワークフロー → AWSでLLMアプリをつくろう

6.3K Views

July 25, 23

#jawsug #jawsug_tokyo #langchain #kendra #openai #llm #cydas #serverlessdays #AWS #Large Language Models #Workflow #RAG #Security

スライド概要

2023.07.24 JAWS-UG東京で話した資料です。

吉田真吾

@yoshidashingo

スライド一覧

吉田真吾

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.4M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.2M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.2M

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

ue5 cedec+kyushu ue-animation ue-optimize ue-bp ue-physics ue-sequencer

エピックゲームズジャパン 1M

最新の6.0で学ぶ！初めてのひとのためのSpring Security

java spring security

tada 1M

各ページのテキスト

AWSで実現する LLMワークフロー(仮) 2023.7.24 JAWS-UG / @yoshidashingo

吉田真吾 AWS Serverless Hero n p p 113 p AWS / SA Oracle n ( ) p ( ) p AWS n AWS AWS Lambda Amazon S3 BRAv6 p AWS CTO SaaS DevOps (2012 ) p AWS Samurai 2014 / 2016 p AWS Serverless Hero

https://tokyo.serverlessdays.io/ ↓ “Get Tickets” ↓ 𝕏 “ServerlessDays Tokyo 2023 に参加を申し込みました！”

https://tokyo.serverlessdays.io/

RAG(検索拡張生成)アプリ「CYDAS PEOPLE」に、社員からの問い合わせに自動で答えるChatGPT機能「CYDAS PEOPLE Copilot Chat」 https://www.cydas.co.jp/news/press/202304_people-gpt/

https://www.cydas.co.jp/news/press/202304_people-gpt/

世は大LLM時代 AIの民主化 = アプリ開発者がLLMアプリをユーザーに届けやすい時代もっと小難しいもんかと思ってたよ

タスク ❌ → 業務 ⭕ = ワークフロー複数のタスクをプログラミングによる制御と、LLMによる制御をつないで実現する

学んだこと 1. RAGは実装しやすい→[UX観点]従来の検索UI(LLMsなし)で解決できる？ 2. 埋め込み表現(Embeddings)取得してベクター類似検索するより、エンタープライズ検索のほうがたいてい、すべてにおいて良い 3. LLMの能力を活かすワークフローが重要 1. 2. 出力が確定的なプログラミングと、非確定的なLLMの組み合わせ複数のタスクをチェインしていく🦜🔗 4. 🦜🔗はアイデア＋実装の宝庫 1. 2. ReAct → langchain.agents HyDE → 質問の答えをLLMが妄想して、その答えに類似した知識を検索 from langchain.chains import HypotheticalDocumentEmbedder 5. LLMOps MLOps 1. 2. 3. 入力の変化 / 出力の変化に気づきづらい気づいたとてできることが限られる = APIやモデルの差し替え、プロンプトの調整(＋バージョン管理) レスポンスタイムなどは取得しておくべきだろう ex) LangSmith

10.

Amazon Kendra + 🦜🔗 ⾼精度な⽣成系 AI アプリケーションを Amazon Kendra、LangChain、⼤規模⾔語モデルを使って作る https://aws.amazon.com/jp/blogs/news/quickly-build-high-accuracy-generative-ai-applications-on-enterprisedata-using-amazon-kendra-langchain-and-large-language-models/

https://aws.amazon.com/jp/blogs/news/quickly-build-high-accuracy-generative-ai-applications-on-enterprise-

11.

🦜🔗 学ぶなら Udemy - LangChainによる大規模言語モデル（LLM）アプリケーション開発入門―GPTを使ったチャットボットの実装まで https://www.udemy.com/course/langchain-apps/

https://www.udemy.com/course/langchain-apps/

12.

🦜🔗 学ぶならもくもくLangChain https://langchain-jp.connpass.com/event/289590/

https://langchain-jp.connpass.com/event/289590/

13.

セキュリティとプライバシー本番環境利用に向けて

14.

AWSのクラウドセキュリティ/データ保護 • 事実 • AWSはセキュリティに莫大な投資：複数のサービス、複数のコンプライアンス準拠 • クラウドをクラウドたらしめてるもの = AIによるコントロール • 予測 • [1/5] セキュリティは組織のあらゆる活動に不可欠になる • [3/5] AI/機械学習で促進されたオートメーションがセキュリティを強化する • Amazon GuardDuty、Amazon Detective、Amazon CodeGuru、Amazon Macie… • [4/5]データ保護へのより大きな投資が進む • GDPR同様の規制の世界各国への広がり・実運用の強化 CJ Moses による 2023 年以降のセキュリティに関する予測 https://d1.awsstatic.com/Security/Security_Predictions_e-book_2022_JP.pdf

https://d1.awsstatic.com/Security/Security_Predictions_e-book_2022_JP.pdf

15.

OWASP Top10 LLMアプリ[draft] 1. プロンプトインジェクション 6. • LLMが意図しない動作を引き起こすプロンプトの上書き 2. 安全でない出力処理 • 応答で機密データを漏洩する可能性→不正アクセス、プライバシー侵害、セキュリティ侵害 7. • バックエンドシステムの情報が出力されることによる悪用 3. トレーニングデータの汚染 8. 5. サプライチェーンの脆弱性 • プラグインや3rdパーティのコンポーネントからの侵害エージェントの暴走 • 自律的なエージェントが意図しない結果をもたらすアクションを実行する可能性モデルへのDoS • 大量のトークン消費、レスポンス悪化、コスト高騰安全でないプラグイン設計 (※5と類似?) • プラグインから安全でない入力により脆弱性が悪用される • セキュリティ、有効性、倫理的ふるまいへの影響 4. 機密データの漏洩 9. 過度な依存 • 不正確・不適切な生成コンテンツに依存してデマ、法的問題、セキュリティ脆弱性に直面する 10. モデル泥棒 • 独自モデルへの不正アクセス、流出→経済損失、競争優位性低下 (※蒸留ファインチューニングもグレーかも) OWASP Top 10 for Large Language Model Applications https://owasp.org/www-project-top-10-for-large-language-model-applications/

https://owasp.org/www-project-top-10-for-large-language-model-applications/

16.

個人データ保護法制：チェックすべき論点 • 何を保護するのか→「個人の権利利益」 • 個人データ保護の「決定指向」利益モデル • 自己情報コントロール権ではなく、情報的他律からの自由 • われわれに何が求められうるのか • 自己情報コントロール権=財産権的モデルの本人同意原則(オプトイン/オプトアウト)→なにが個人情報でなにが個人情報でないという議論になる • 情報的他律=個人データ処理に基づく他者による評価・決定が本人の自己決定を阻害しうること→からの自由(防御できること) • たとえば • 古い属性情報、あいまいな属性情報で職場での評価が決められた ※そもそもOECD原則(データ品質の原則)にも反しているが。 • 関連性のない情報で不利なクレジットスコアが決定された → これらをシステムでモニタリングする不断の努力が求められうる • 理論的基礎から法体系への整理 • 統制された非選別利用→医療仮名加工情報：統計量に集計したデータ、または二次利用 • 個人データ処理中心の規律→処理対象としないデータのマスキング、オプトイン処理の負担 • 評価・決定の適切性確保→選別アルゴリズム(適性で選別した教育プログラム、OK？) 【提⾔書公表】デジタル社会を駆動する『個⼈データ保護法制』に向けて（GLOCOM六本⽊会議） https://www.glocom.ac.jp/news/news/8540

https://www.glocom.ac.jp/news/news/8540

17.

🦜🔗 Experimental パッケージ分割 • ビッグニュース • CVE(脆弱性)を含む機能をすべて別パッケージ(Experimental)に • 🦜🔗コアのスリム化 • Communityチェインというパッケージの計画にも言及 • 意味すること • 本番では使えない → 使いうる • この1年弱、無制限に拡張される一方だったのでLambda Layerにいつか乗らなくなる → 一定の交通整理がされるようになる • 論文の実装や野心的なアイデアの実装がよりPR出しやすくなる • AWS Lambdaでの利用 • 現在のサイズ：依存ライブラリ含めた展開後サイズで130MB程度 • スピンアップにはおおむね5秒程度はかかる→Slackから使う場合は Lazyリスナーやリトライヘッダのチェックなど複数の対策が必要

18.

https://tokyo.serverlessdays.io/ ↓ “Get Tickets” ↓ 𝕏 “ServerlessDays Tokyo 2023 に参加を申し込みました！”

https://tokyo.serverlessdays.io/

19.

DAYS史上最高のラインナップ • 豪華セッション • キーノート：AWS • (1)サーバーレス10年の成熟 • (2)サーバーサイド主体からエッジ/フロントへの開発ライフサイクルの変化 • (3)生成AIとサーバーレス • 豪華スポンサー • • • • • • AWS Momento PingCAP (TiDB) Microsoft KDDIアジャイル開発センター Serverless Operations