171 Views
December 24, 24
スライド概要
■Amazon BedrockのServerlessモデル一覧:リージョン別(2024-12-16現在)
■Amazon BedrockのServerlessモデル一覧:提供時期別(2024-12-16現在)
■AWS re:Invent 2024で発表されたServerlessモデル(現在利用可能)
■AWS re:Invent 2024で発表されたServerlessモデル(近日公開予定)
■Amazon BedrockのMarketplaceモデル一覧(2024-12-16現在)
■Amazon Bedrockが目指しているものとは(私見)
■まとめ
参考:
https://hidekazu-konishi.com/entry/amazon_bedrock_models_as_of_2024.html
Profile: https://hidekazu-konishi.com/
Blog: https://hidekazu-konishi.com/entry/
Profile: https://hidekazu-konishi.com/ Blog: https://hidekazu-konishi.com/entry/ Books: https://amzn.to/48zwojS Bookmarks: https://b.hatena.ne.jp/site/hidekazu-konishi.com/?sort=count
AWS re:Invent 2024 re:cap LT大会(2024-12-17) Amazon Bedrockの最新モデル総まとめ2024 小西秀和 (Hidekazu Konishi) 2020-2024 Japan AWS Top Engineer (Services) 2020-2024 Japan AWS All Certifications Engineer ※この発表資料に含まれる意見や見解は、個人的なものであり、 所属する組織や会社の公式な立場や意見を代表するものではありません。
|E| = 46, |W| = 44 |E ∪ W| = 52, |M| = 122 |E ∪ W| + |M| = 174 1
Number of Models (as of 2024-12-16) |E| = 46, |W| = 44 Serverless (us-east-1) Serverless (us-west-2) |E ∪ W| = 52, |M| = 122 Serverless Bedrock Marketplace |E ∪ W| + |M| = 174 Serverless Bedrock Marketplace Total 2
Amazon BedrockのServerlessモデル一覧:リージョン別(2024-12-16現在) ◼ プロバイダ別モデルタイプ別モデル一覧(N. Virginia[us-east-1]とOregon[us-west-2]をマージしたもの) プロバイダ モダリティ モデル名 AI21 Labs Text Jurassic-2[Ultra, Mid], Jamba 1.5[Mini, Large], Jamba-Instruct Amazon Text Nova Micro, Titan Text G1[Lite, Express, Premier], Rerank 1.0 Text & Vision Nova[Pro, Lite] Image Nova Canvas, Titan Image Generator G1[v1, v2] Video Nova Reel Embeddings Titan Multimodal Embeddings G1, Titan Text Embeddings V2, Titan Embeddings G1 – Text Text Claude 3.5[Haiku], Claude[v2.1, v2.0], Claude Instant[v1.2] Text & Vision Claude 3.5[Sonnet v2, Sonnet], Claude 3[Haiku, Sonnet, Opus] Text Command R+, Command R, Command, Command Light, Rerank 3.5 Embeddings Embed Multilingual, Embed English Text Llama 3.2[1B Instruct, 3B Instruct], Llama 3.1[8B Instruct, 70B Instruct, 405B Instruct], Llama 3[8B Instruct, 70B Instruct] Text & Vision Llama 3.2[90B Vision Instruct, 11B Vision Instruct] Mistral AI Text Mistral Large 2, Mistral Large, Mistral Small, Mixtral 8x7B Instruct, Mistral 7B Instruct Stability AI Image SD3 Large 1.0, Stable Image Core 1.0, Stable Image Ultra 1.0, SDXL(1.0) Anthropic Cohere Meta ※斜体(赤茶色)はN. Virginia[us-east-1]のみ利用可能なモデル ※下線(青色)はOregon[us-west-2]のみ利用可能なモデル 3
Amazon BedrockのServerlessモデル一覧:提供時期別(2024-12-16現在) ◼ プロバイダ別モデルタイプ別モデル一覧(N. Virginia[us-east-1]とOregon[us-west-2]をマージしたもの) プロバイダ モダリティ モデル名 AI21 Labs Text Jurassic-2[Ultra, Mid], Jamba 1.5[Mini, Large], Jamba-Instruct Amazon Text Nova Micro, Titan Text G1[Lite, Express, Premier], Rerank 1.0 Text & Vision Nova[Pro, Lite] Image Nova Canvas, Titan Image Generator G1[v1, v2] Video Nova Reel Embeddings Titan Multimodal Embeddings G1, Titan Text Embeddings V2, Titan Embeddings G1 – Text Text Claude 3.5[Haiku], Claude[v2.1, v2.0], Claude Instant[v1.2] Text & Vision Claude 3.5[Sonnet v2, Sonnet], Claude 3[Haiku, Sonnet, Opus] Text Command R+, Command R, Command, Command Light, Rerank 3.5 Embeddings Embed Multilingual, Embed English Text Llama 3.2[1B Instruct, 3B Instruct], Llama 3.1[8B Instruct, 70B Instruct, 405B Instruct], Llama 3[8B Instruct, 70B Instruct] Text & Vision Llama 3.2[90B Vision Instruct, 11B Vision Instruct] Mistral AI Text Mistral Large 2, Mistral Large, Mistral Small, Mixtral 8x7B Instruct, Mistral 7B Instruct Stability AI Image SD3 Large 1.0, Stable Image Core 1.0, Stable Image Ultra 1.0, SDXL(1.0) Anthropic Cohere Meta ※斜体(緑色)は2024年1月~AWS re:Invent 2024前に利用可能になったモデル ※下線(橙色)はAWS re:Invent 2024で利用可能になったモデル 4
AWS re:Invent 2024で発表されたServerlessモデル(現在利用可能) ◼ プロバイダ別モデルタイプ別モデル一覧(N. Virginia[us-east-1]とOregon[us-west-2]をマージしたもの) プロバイダ モダリティ モデル名 概要 Cohere Text Rerank 3.5 Amazon Text Rerank 1.0 RAGアプリケーションの検索精度を向上させるためのモデル。ユーザークエリと検索された 文書群を入力とし、関連性に基づいて再ランク付けを行い、モデル入力として最適な文 書を優先的に選択することで、生成応答の質を向上させる。 Text Nova Micro 最小限のレイテンシーで高速処理が可能なテキスト専用モデル。128Kトークンの文脈長 で、要約・翻訳・分類・対話・コーディングなどの基本タスクに最適化。ファインチューニン グに対応。 Text & Vision Nova Lite 高速な処理が可能な低コストのマルチモーダルモデル。画像・動画・テキストの入力から 文章を生成。300Kトークンまでの入力と複数画像・30分までの動画分析が可能。ファ インチューニングに対応。 Text & Vision Nova Pro 精度・速度・コストのバランスに優れた高性能マルチモーダルモデル。300Kトークンまでの 入力に対応し、視覚的質問応答や動画理解で最高水準の性能を実現。APIやツール 連携による複雑なワークフローの実行が可能。ファインチューニングに対応。 Image Nova Canvas 高品質な画像生成が可能な最先端モデル。スタイルやコンテンツの精密な制御、イン ペイント(部分修正)、アウトペイント(画像拡張)や背景除去などの編集機能を搭載。 画像生成の忠実性評価で高いパフォーマンスを実現。 Video Nova Reel プロフェッショナル品質の動画生成が可能な最先端モデル。テキストや画像からの動画 生成、視覚的スタイルやペースの制御が可能。動画の品質と一貫性において優れたパ フォーマンスを発揮。 ※斜体(赤茶色)はN. Virginia[us-east-1]のみ利用可能なモデル ※下線(青色)はOregon[us-west-2]のみ利用可能なモデル 5
AWS re:Invent 2024で発表されたServerlessモデル(近日公開予定) プロバイダ モダリティ モデル名 概要 Amazon Text & Vision Nova Premier 複雑な推論タスク向けの最上位マルチモーダルモデル。カスタムモデルの知識蒸留(大 規模モデルから小規模モデルへの確率分布と中間層の潜在表現を知識転移)のため の教師モデルとしても最適。2025年初頭リリース予定。 poolside Text malibu コード生成、テスト作成、リファクタリング、ドキュメント作成といった高度なタスクなど複 雑なソフトウェアエンジニアリングの課題に特化したモデル。アシスタントと連携すること で、開発者のIDE内で直接利用でき、ナレッジベースに基づいてファインチューニングされ、 組織固有のニーズに応える柔軟性がある。 Text point 高度なコンテキスト認識を活用して開発者のニーズを正確に予測する迅速なコード補 完に特化したモデル。アシスタントと連携することで、開発者のIDE内で直接利用でき、 ナレッジベースに基づいてファインチューニングされ、組織固有のニーズに応える柔軟性が ある。 Stability AI Image Stable Diffusion 3.5 Large Stability AIが提供する最新の高性能画像生成モデル。 テキストから高品質で美しい 画像を生成可能。 コンセプトアート制作やビジュアルエフェクト、詳細な商品画像の作 成を効率化。 Luma AI Video Ray 2 テキストや画像プロンプトから10秒程度で高品質な動画を生成できる最新の動画生 成モデル。 滑らかな動き、高度な撮影技法、ダイナミックなカメラワークを実現し、最大 1分間の映像を作成可能。 6
Amazon BedrockのMarketplaceモデル一覧(2024-12-16現在) プロバイダ カテゴリ モデル名 HuggingFace Text Generation, Text Summarization, Automatic Speech Recognition等 モデル数:83種類。主要シリーズ:BART, Bloom, DBRX, Dolly, EleutherAI GPT, Falcon, Flan-T5, Gemma, Mistral, MPT, Phi, Yi, Zephyrなど Arcee AI Text Generation Arcee[Lite, Nova, SuperNova], Llama Spark, Llama 3.1 SuperNova Lite Camb.ai Text To Audio MARS6 EvolutionaryScale, PBC Multimodal Generation ESM3-open Gretel Text Generation Gretel Navigator Tabular IBM Data and AI Text Generation IBM Granite[8B Code Instruct - 128K, 3B Code Instruct - 128K, 34B Code Instruct - 8K, 20B Code Instruct - 8K], Granite 3.0[8B Instruct, 2B Instruct] John Snow Labs Text Summarization Medical LLM[Small, Medium] Translation Medical Text Translation (EN-ES) Karakuri, Inc. Text Generation KARAKURI LM 8x7b instruct LG CNS Text Generation EXAONE_v3.0 7.8B Instruct Liquidai Text Generation Liquid LFM[40B (L40S), 40B (H100), 40B (A100)] NCSoft Text Generation Llama-3-Varco-Offsetbias-8B, VARCO LLM KO/EN-13B-IST NVIDIA Text Generation NVIDIA Nemotron-4 15B NIM Microservice Preferred Networks, Inc. Text Generation PLaMo API Stability AI Text To Image Stable Diffusion 3.5 Large Stockmark Inc. Text Generation Stockmark-LLM-13b Upstage Text Generation Solar[Pro, Pro – Quant], Solar Mini[Chat, Chat – Quant, Chat ja, Chat ja – Quant] Widn.AI Translation Widn Tower Sugarloaf, Widn Tower Anthill, Widn Llama3-Tower Vesuvius Writer Text Generation Writer Palmyra-Med-70B-32K, Writer Palmyra-Fin-70B-32K 7
Amazon Bedrockが目指しているものとは(私見) ◼ AWS re:Invent 2024のAmazon Bedrock全体の発表を振り返ると ◆RAG(検索拡張生成)機能の強化 ・RerankモデルとAPI導入による検索最適化 ・ストリーミング出力によるユーザー体験向上 ・カスタムコネクタとストリーミング取込の実装 ・GraphRAGやKendra GenAIインデックスと の連携 ◆マルチモーダル対応の拡充 ・Novaシリーズによる様々なモデル提供 (テキスト、画像、ビデオ、音声) ・ナレッジベースのマルチモーダルデータ取込 ・画像に対する毒性検出機能 ◆モデル最適化とパフォーマンス向上 ・レイテンシー最適化オプションの導入 ・モデル蒸留機能の実装 ・プロンプトキャッシュ対応 ・プロンプトルーティング機能 ◆エコシステムの拡大 ・Bedrockマーケットプレイスの導入 ・新規モデルプロバイダーの追加 ・サードパーティ製モデルの統合 ◆品質管理・評価機能の強化 ・LLM-as-a-judgeによるモデル評価 ・ナレッジベースの評価機能 ・ガードレールの機能拡張 ・自動推論チェックの導入 ◆自動化・効率化の推進 ・データオートメーション機能の導入 ・構造化データのクエリー対応 ・マルチエージェントのコラボレーション機能 ・エンタープライズ利用を想定した信頼性・安全性の向上 ・Bedrock利用システム全体のパフォーマンスと効率性の向上 ・ユーザーや開発者体験の改善と導入障壁の低下 ・より幅広いユースケースへの対応 8
Amazon Bedrockが目指しているものとは(私見) ◼ AWS re:Invent 2024のAmazon Bedrock全体の発表を振り返ると ◆RAG(検索拡張生成)機能の強化 ・RerankモデルとAPI導入による検索最適化 ・ストリーミング出力によるユーザー体験向上 ・カスタムコネクタとストリーミング取込の実装 ・GraphRAGやKendra GenAIインデックスと の連携 ◆マルチモーダル対応の拡充 ・Novaシリーズによる様々なモデル提供 (テキスト、画像、ビデオ、音声) ・ナレッジベースのマルチモーダルデータ取込 ・画像に対する毒性検出機能 ◆モデル最適化とパフォーマンス向上 ・レイテンシー最適化オプションの導入 ・モデル蒸留機能の実装 ・プロンプトキャッシュ対応 ・プロンプトルーティング機能 ◆エコシステムの拡大 ・Bedrockマーケットプレイスの導入 ・新規モデルプロバイダーの追加 ・サードパーティ製モデルの統合 ◆品質管理・評価機能の強化 ・LLM-as-a-judgeによるモデル評価 ・ナレッジベースの評価機能 ・ガードレールの機能拡張 ・自動推論チェックの導入 ◆自動化・効率化の推進 ・データオートメーション機能の導入 ・構造化データのクエリー対応 ・マルチエージェントのコラボレーション機能 ※赤枠:モデルに関する発表 ・エンタープライズ利用を想定した信頼性・安全性の向上 ・Bedrock利用システム全体のパフォーマンスと効率性の向上 ・ユーザーや開発者体験の改善と導入障壁の低下 ・より幅広いユースケースへの対応 9
まとめ ◼ AWS re:Invent 2024のAmazon Bedrock全体として ⚫ エンタープライズ利用を想定した信頼性・安全性の向上 ⚫ Bedrock利用システム全体のパフォーマンスと効率性の向上 ⚫ ユーザーや開発者体験の改善と導入障壁の低下 ⚫ より幅広いユースケースへの対応 ◼ Amazon Bedrockのモデルにフォーカスすると ⚫ Amazon Novaシリーズの追加によってマルチモーダル含め、Amazonの独自AIモデルが強化された ⚫ Rerankモデル(Amazon Rerank, Cohere Rerank)の追加によってRAG検索精度を向上できるようになった ⚫ Amazon Bedrock Marketplaceの登場によってさらに豊富なモデルが利用可能 Amazon Bedrockの機能追加、モデルの追加や廃止のサイクルが早い。 このことを考慮した、キャッチアップやシステム構築がポイントになってくる。 特に運用フェーズに入っている場合は、現在使用しているモデルの代替えを 想定して、常に試行して最新モデルを把握していく必要がある。 10