>100 Views
February 16, 26
スライド概要
AWS 若手LT大会 #2で発表した内容です。
AWS 若手LT大会 #2 機械学習ミリしらが作る Sagemaker canvasを使った大気汚染予測アプリ 2026/2/162025/09/30 阿部健太郎 あべけん@食パン
自己紹介 名前:阿部健太郎(食パン) 年次:社会人3年目 業務:ポータルサイトの保守運用 @Plainbread2009 @Plainbread2009 好きなサービス:Step Functions @Plainbread2009 2
今日話すこと ・話すこと ・SageMaker Canvasで作成したモデルの呼び方 ・推論モデルを使ったアプリケーションの構成 ・話さないこと ・SageMaker Canvasの使い方とモデルの作り方 ・精度の話 若手AWS なんでもLT会 #2で発表 3
目次 1.自己紹介 2.話すこと、話さないこと 3.SageMaker Canvasとは? 4.アプリの構成 5.動作確認 6.まとめ 4
SageMaker Canvasとは ・SageMaker(Studio) 機械学習モデルの構築・学習・デプロイを一括で行えるサービス コードベースで高度なカスタマイズが可能 ・SageMaker Canvas ノーコードで機械学習モデルを作成・予測できるサービス GUIベースで操作でき、専門知識が少なくても利用できる 特徴 SageMaker Studio Sagemaker Canvas 操作方法 コードベース(Pythonなど) ノーコード(GUI) 柔軟性 高い(細かい制御が可能) 低め(簡単に使えるが制限あり) 学習・予測 自由に設定可能 自動で最適化される 利用シーン 本格的なML開発 手軽な予測・分析 5
光化学オキシダント(Ox) 光化学オキシダント(Ox)は二次汚染物質 二次汚染物質:大気中において、化学変化によって生成される 発生源が特定しにくい。 Oxは以下のような問題 ①環境基準達成率が0.2%(2020年) 早急な対策がもめられている ②健康被害があるため大気汚染防止法で 注意報や警報が定義。 実測が基準値を超えてから発令されるため、回避が難しい 出典:環境省・文部科学省 ECO学習ライブラリーより 既存のモデルは短期的な予測は難しい! SageMaker Canvasで予測を試してみる 6
アプリ構成 ・1時間おきに1時間先の濃度予測を実施 ・基準値を超えた時にSNSでアラートを通知 入力データ 取得 予測とデータ の保存 予測濃度が 一定以上で通知 7
モデルの呼び出し方(リアルタイム推論) ①リアルタイム推論 リクエストとして受けたデータを順次処理する 用途:API連携、即時返答が必要なアプリ ・Real-Time Inference 常時インスタンスが起動している いつでも実行でき、レイテンシが最短(ミリ秒台) その分起動している間従量課金となるため高額化の可能性 ・Serverless Inference 呼ばれたときだけ背後のコンテナが起動 待機コストが0で呼ばれた時だけ課金される コールドスタートがあり遅いことがある 8
モデルの呼び出し方(バッチ推論) ②バッチ推論 リクエストとして受けたデータを順次処理する 用途:大量データの一括処理、日次・月次バッチ ・Batch Transform 「毎日0時に推論」など、スケジュールを組んで実施可能 リアルタイムでは推論結果を確認することができない ③非同期推論 非同期で推論を実行し、処理完了後に結果をS3に出力する 用途:非同期処理、処理待ちが発生する処理 ・Asynchronous Inference 画像や動画解析等の重い推論に最適。大量ではなく重い 9
モデルの呼び出し方(まとめ) リアルタイム リアルタイム推論 サーバレス推論 マイクロバッチ バッチ 非同期推論 バッチ変換 実行モード 同期 非同期 非同期 予測レイテンシー 秒以下 数秒~数分 不定 実行頻度 可変 可変 可変 / 固定 呼び出しモード 連続ストリーム / APIコール 推論データサイズ ユース ケース 小( < 6MB) 商品レコメンド イベントベース イベント / スケジュールベース 中( < 1GB) 大( > 1GB) PDFや契約書などの 医療画像、動画などの 大量ファイルの解析 重い推論処理 データサイズや推論 時間が長いケース 10
リアルタイム推論のやり方① ①エンドポイントを作る 11
リアルタイム推論のやり方② ②Lambdaから呼ぶ。 リアルタイム推論 S3からデータを取る 同期リクエスト バイト列 12
バッチ推論のやり方① ①Lambdaから呼ぶ。 バッチ推論 Lambda自体は 結果を返さない 後段にlambdaが必要になる バッチ推論 13
まとめと今後 ・モデルのデプロイ方法は大きく2種類 ・リアルタイム推論とバッチ推論 ・要件に合わせて最適な選択を行う ・私の要件だとサーバレスかバッチ? ・デプロイするところまで来たので、 アプリケーション化も進める 14
ご清聴ありがとうございました 15