Amazon Bedrock ガードレール入門

884 Views

September 07, 24

#jawsug #jawsug_ohenro #Amazon Bedrock #Guardrails #生成AI #責任あるAI #AIセキュリティ

スライド概要

四国クラウドお遍路 2024 in 高知で発表したときの資料です。
Amazon Bedrockのガードレール機能の概要をについて調べた内容を話しました。
https://jawsug-sikoku.connpass.com/event/322019/

丹羽智紀

@int28_t

スライド一覧

組み込み系、AWSのバックエンド・アプリケーションエンジニアです。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

福岡市の隅っこで世界に向けて AWS を叫ぶ

jawsug jawsfesta2023 jawsfesta

丹羽智紀 118

KH Coder 3 チュートリアル

HIGUCHI Koichi 733.1K

エンジニアとQAの壁が崩れていくのを眺めていた #scrumosaka

scrumosaka 2024 scrum agile

asato 268.1K

【初心者向け】UE5 シーケンサーと Movie Render Queue の使い方【Cinematic Dive 2023】

ue5 ue-nongame

エピックゲームズジャパン 252.8K

シェーダコードも怖くない？UEのCustomノードで学ぶHLSL入門

ゲームメーカーズスクランブルゲーム制作 ue5 シェーダー

ゲームメーカーズ 217.5K

【2023年版】ゲーム制作の現場でよく使うツールをまるっと紹介

ゲームメーカーズスクランブルゲーム制作ツール紹介

ゲームメーカーズ 192.9K

各ページのテキスト

Amazon Bedrock ガードレール入門

自己紹介所属: 株式会社ウフル名前: 丹羽智紀好きなAWSサービス - AWS Step Functions - AWS CDK 1

Amazon Bedrockとは様々なAIモデルを簡単に利用できる、フルマネージド型の生成AIサービス AWS Cloud Amazon Bedrock ユーザー入力アプリ API マネコン AIからの回答推論用入力ガードレール用入力基盤モデル出力最終出力ガードレール 2

ガードレールを使用する動機最新のAIモデルのほとんどが、すでに標準で不適切な回答を防ぐための仕組みを搭載している Amazon BedrockのGuardrailsはサービス提供者/利用者が追加でのガードレールの機能(安全性・堅牢性・セキュリティ)を追加で行うことが出来る (第二の防衛ライン的な役割) 安全性：有害な入力に対してシステムを守る堅牢性：有害な入力に対して適切な出力をする 3

事例 (Slack AI) 「パブリックチャンネル」からSlack AIが学習した「プライベートチャンネル」のAPIキーを聞き出せた (2024年8月14日) 被害者はパブリックチャンネルに居ない、攻撃者はプライベートチャンネルに居ない状況で攻撃を成功問題点：システムプロンプトとユーザープロンプトが区別出来ないため、悪意のあるメッセージを学習してしまう。 (学習したものは、LLMは正しいと判断して回答しまう傾向にある) 引用: https://promptarmor.substack.com/p/data-exfiltration-from-slack-ai-via 4

Amazon Bedrock Guardrails 生成AIのアプリケーションに、責任あるAIポリシー(安全性・堅牢性・プライバシー・セキュリティなど)を実現するための機能ガードレール単語フィルター責任あるAIポリシーコンテンツフィルター機密情報フィルター拒否トピックコンテキストに基づくグラウンドチェック 5

ガードレールの種類と求められること ① 倫理的ガードレール(コンテンツフィルター、単語フィルター) 差別、偏見、有害である可能性のある入力、出力を防止 ② コンプライアンスガードレール (拒否されたトピック / 機密情報フィルター ※一部) モデルの出力に対するデータ保護、プライバシーやポリシーなどが対象の分野の法的要件を満たす (例: 医療、金融、個人情報保護など法律) ③ コンテキストガードレール (コンテキストに基づくグラウンドチェック) 必ずしも有害ではないが、文脈によって有害になる出力を防止これまでの出力やRAGで追加検索した結果とモデルの出力の整合が取れているかを出力 ④ セキュリティガードレール(機密情報フィルター ※一部) 機密情報が漏洩したり、誤った情報の拡散を防ぐ ⑤ 適用型ガードレールガードレール自体がモデルと共に進化し、倫理観や法的基準が継続的に整合性が保たれる ※括弧の中は対応するBedrockのガードレールの機能 attri ブロクより引用 https://attri.ai/blog/a-comprehensive-guide-everything-you-need-to-know-about-llms-guardrails 6

https://attri.ai/blog/a-comprehensive-guide-everything-you-need-to-know-about-llms-guardrails

採用する観点 (主観) • 適合しそうなケース – toCやtoBとしてプロダクションのケース不適切な回答にやハルシネーションにより、信頼を損ねると損失になるケース • 適合しなさそうなケース – 社内向けでサービスでアイディアを募るなど、正確性よりクリエイティブ正を求める用途や、やり直しが聞く場合 7

費用 • 推測が入らない(機密情報の正規表現やワードフィルタ) は無料 • 推論が入る場合は機能ごとに費用がかかる料金体系：2024/09/06時点費用は1000文字ごとに1ユニット切り上げ 8

10.

使い方 • モデル推論時(InvokeModel/InvokeModelWithResponseStream API やモデルに依存しない共通アクセスの Converse API)のパラメータにガードレールIDを渡す • ApplyGuardrail API を用いてプロンプト or 回答結果に対して直接ガードレールを適用する • ナレッジベースをクエリするとき(RetrieveAndGenerate API)のパラメータにガードレールのIDを渡す • Agents for Amazon Bedrock でエージェント作成時に関連付ける応答：各フィルターごとの0.0〜1.0のスコアと干渉有無と回答(修正があれば修正された回答) 9

11.

Amazon Bedrock ガードレールまとめ • モデルがもともと持つ不適切な回答を防止する機能に追加出来る防ぐ機能 • 単語登録やトピック登録など簡単なチューニングで利用できるマネージサービス 10

12.

ご清聴ありがとうございました AIの活用でより良いサービスの提供を皆さんと考えて行きたいと考えていますコメントを頂けると幸です 11

Amazon Bedrock ガードレール入門

丹羽 智紀

関連スライド

福岡市の隅っこで世界に向けて AWS を叫ぶ

KH Coder 3 チュートリアル

エンジニアとQAの壁が崩れていくのを眺めていた #scrumosaka

【初心者向け】UE5 シーケンサーと Movie Render Queue の使い方【Cinematic Dive 2023】

シェーダコードも怖くない？UEのCustomノードで学ぶHLSL入門

【2023年版】ゲーム制作の現場でよく使うツールをまるっと紹介

各ページのテキスト

丹羽智紀