3.5K Views
June 28, 24
スライド概要
第48回 Tokyo Jazug Nightの資料です。
Japan Azure User Group Core Member / Microsoft MVP for Microsoft Azure
俺的 Build 2024 (付近の) アップデートまとめ
自己紹介 足利 惟@yuiashikaga 株式会社 pnop 所属 Microsoft Azure だけでお仕事してます Azureが登場した直後(2011年くらい)から触ってます Japan Azure User Group (JAZUG) 運営メンバー 勉強会の企画、運営、登壇などを通じてAzureの魅力を発信 Xで「#jazug」検索!! Microsoft MVP for Azure (2016年4月~) 最近は家族でけん玉にお熱 2
はじめに 本セッションは 2024年6月27日 現在の情報を基に作成してます 最新情報はWebで!! 3
このセッションの注意点 Build 2024 前中後の Azure アップデートを概要レベルでご紹介 すべてのアップデートを紹介するわけじゃないよ あくまで「俺的」な視点での Update おさらいなので悪しからず 4
AZ間のデータ転送が無料に プライベートIP・パブリックIP関係なし 西日本にもはよ 5
Microsoft Copilot in Azure (Preview) 提供範囲が拡大(すべての顧客へ順次公開) テナント内の特定ユーザー・グループにアクセスを許可するかを選択可能 Copilot in Azureで出来ること リソース情報の取得 リソースのデプロイ Azure PowerShell, CLIスクリプト生成 API Management ポリシー作成 自然言語からSQLクエリ生成 日本語は未サポート(言語設定を英語にする必要あり) 6
GPT-4o (Preview) Azure OpenAI Serviceで利用可能に 標準デプロイ:eastus, eastus2, northcentralus, southcentralus, westus, westus3, Sweden Central プロビジョンドデプロイ:Japan East, Korea Central, Sweden Central, Switzerland North, & West US 3 マルチモーダル対応 テキスト、視覚、音声に対応(現在はプレビュー中につき、テキストと画像のみ) GPT-4に比べて安い!速い!! 7
Model as a Service 8
NTT Data提供モデル 9
Azure AI Search Update より大きなベクターワークロードをサポート パーティションあたりの総ストレージが3倍から6倍に増加 パーティションあたりのベクトル・インデックス・サイズが5倍から12倍に拡大 インデックス作成とクエリのスループットが最大2倍向上 10
Azure AI Search Update より大きなベクターワークロードをサポート 11
Azure AI Search Update ベクターストレージを最適化する新しいベクター検索機能 Edm.Singleフィールドのベクターインデックスサイズを75%削減し、ディスク上のベ クターストレージを~25%削減 ベクトルフィールドにStoredプロパティを設定することで、ベクトルのストレージオー バーヘッドを削減 12
Azure Cosmos DB for NoSQL built-in vector search (Preview) ベクターインデックス作成と検索機能を提供 ベクター検索とAzure Cosmos DBの豊富なクエリフィルタを簡単に組み 合わせることが可能 インデックス作成方法は次の3種類 flat:精度は高いが検索時間がかかる可能性あり quantizedFlat:ベクター値を圧縮するので時間は短くなるが、flatより精度が 低くなる可能性あり diskANN:Microsoft Researchによって開発されたアルゴリズムを使用。時間 が短くRUの消費も少ないが、プレビュー中なので制度に低い可能性あり ベクトル化&CosmosDBへの格納は自分たちで行う必要がある 13
In-database embeddings in Azure Database for PostgreSQL - Flexible Server (Preview) PostgreSQLデータベースと同じVM内にデプロイされたモデルからテキスト 埋め込みを作成 デプロイされるモデルは「multilingual-e5-small」 次元数は384 (text-embedding-ada-002は1536) 東日本リージョンでも使用可能 14
Web Apps 一意の既定ホスト名対応 (Preview) サブドメイン乗っ取りの脅威を回避するため、固有のデフォルトホスト名を 持つウェブアプリケーションを作成可能に サブドメイン乗っ取りとは 既存のWebを削除した後、DNSエントリをクリアするのを忘れた場合 悪意のある業者が侵入して同じ名前のウェブアプリを作成し、既存のDNSレコー ドを使用してドメインを乗っ取る 15
Azure Functions Flex Consumption (Preview) 使った分だけ課金 + VNET統合や常時起動対応 現状最大1000インスタンスまで高速スケーリング インスタンスのメモリサイズ選択可能 (2,048 MB or 4,096 MB) 16
Azure Functions extensions for OpenAI (Preview) Azure OpenAI サービス の機能と動作をFunctionsに統合可能なトリ ガーとバインドを提供 17
Logic Apps の AOAI および Azure AI Search connector (GA) ローコードでRAGパターンを実現 18
Azure API Management GenAI 拡張 Azure OpenAI Token Limit Policy トークンの使用量に基づいて、APIコンシューマーごとの制限を管理および実施 サブスクリプションキー、IPアドレス、またはポリシー式など任意のカウンターキーに 基づいてトークンの制限が可能 19
Azure API Management GenAI 拡張 Azure OpenAI Emit Token Metric Policy Applications Insightsに送信するトークン使用メトリクスを設定可能 プロンプト、完了、トークン使用量の合計のメトリクスを取得し、選択した Application Insights ネームスペースに送信 カスタムディメンションによるきめ細かい分析も可能 20
Azure API Management GenAI 拡張 Load Balancer and Circuit Breaker 複数のAzure OpenAIエンドポイントに負荷を分散可能 ラウンドロビン、重み付け、優先度ベースの負荷分散をサポート 設定は現在のところREST API、Bicep、ARM テンプレートで行う 21
Azure API Management GenAI 拡張 Import Azure OpenAI as an API 既存のAzure OpenAIのエンドポイントをAPIとして簡単にインポート可能 Azure OpenAI用のOpenAPIスキーマを自動的にインポートし、マネージドIDを 使用してAzure OpenAIエンドポイントへの認証を設定 22
Azure API Management GenAI 拡張 Import Azure OpenAI as an API 23
Azure API Management GenAI 拡張 Azure OpenAI Semantic Caching policy 類似した意味を持つプロンプトの回答を保存するセマンティックキャッシングを活 用することで、トークンの使用を最適化 以前の要求に対するプロンプトのベクトル近接性と指定した類似性スコアしきい 値に基づいて、構成された外部キャッシュから応答のキャッシュ検索を実行 24
Log Analyticsに簡易モード (Preview) 通常のKQLモードに加え、クリックのみで簡単なフィルター処理、並び替え、 集計が可能な簡易モードが提供 25
※デモで使用したLog Analytics 26
Log Analytics リージョン間 ワークスペースレプリケーション (Preview) 書き込みデータを別リージョンのワークスペースに非同期コピー リージョンで障害が発生した場合、レプリケートされたワークスペースに切り 替え可能 現時点では北米、ヨーロッパリージョンでサポート セカンダリへの切り替えは手動 27
Azure Bastion Developer SKU (GA) 機能限定、ホストスケーリングしないが無料のSKU (Dev/Test用途) 専用リソースではないので、作成時にAzureBastionSubnetは必要なし 使えるリージョンは限定的 Central US EUAP (Early Updates Access Programs ) East US 2 EUAP West Central US North Central US West US North Europe 28
Azure Bastion Premium SKU (Preview) セッション記録対応 仮想マシン接続後の操作を動画として記録 録画データはBlobに格納 ネイティブ クライアント経由では使用不可 プライベート専用として Bastion をデプロイ (Private Endpoint対応) プライベート IP アドレスのみアクセスが許可されたBastion環境 29
Azure VM の休止状態 (GA) 使われていない VM を一時停止し、コンピューティング コストを節約 VM のメモリの内容を OS ディスクに格納し、割り当てを解除 再び起動されると、メモリの内容がOSディスクからメモリに転送 以前に実行されていたアプリやプロセスは休止前から再開 休止時は課金されない アプリケーションのメモリ消費が多いため起動に長い時間がかかるシステム に有効 基本は~v5シリーズで対応 30
Azure Load Balancer の管理状態 (Preview) バックエンド プール インスタンスごとに Load Balancer の正常性プローブ の動作をオーバーライド可能に メンテナンス、修正プログラムの適用、またはテストのために任意のバックエ ンド インスタンスを停止することが可能 状態の種類 Up:正常性プローブ無視(正常とみなす) Down:正常性プローブ無視(新しい接続を許可しない) None:正常性プローブの動作を考慮(通常) 31
サブスクリプション間ロードバランサー (Preview) LBのフロントエンドやバックエンドインスタンスを、LBが属するサブスクリプ ションとは別のサブスクリプションに置くことが可能 32
Azure Chaos Studio Windows仮想マシン の新しい一時停止プロセス障害をサポート (GA) エージェントベースのフォールトアクション Azure仮想マシン内で実行されているWindowsプロセスを一時停止可能 33
Azure Resource Graph Change Actor (GA) 「誰が」「どのクライアントで」「どんな操作を」リソースに行ったのかを確認可能 変更は5分以内に利用可能になり、14日間クエリ可能 34
アップデートの詳細こちらをチェック Microsoft Build 2024 Book of News https://news.microsoft.com/build-2024-book-of-news/ja/ Azure Update https://azure.microsoft.com/ja-jp/updates/ • 6/27現在メンテナンス中 Azure Updates - Microsoft Community Hub 各チームのBlog Azure/jp-techdocs: A repository for providing Japanese technical documents by volunteer employees belonging to technical divisions in Microsoft Japan. (github.com) 35