機械学習ミリしらが作るSagemaker canvasを使った大気汚染予測アプリ

169 Views

February 16, 26

#SageMaker Canvas #機械学習 #大気汚染 #AWS #LT

スライド概要

AWS 若手LT大会 #2で発表した内容です。

阿部健太郎

@6073979229

スライド一覧

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

JAWS-UG茨城　大年末LT大会　色々活動を頑張って、AWS案件に入ったけど思ってたのと違った話

阿部健太郎 560

クラウド食堂LT会大気汚染予測モデルをSagemakerで作ってみようとした話

阿部健太郎 370

サーバーレスアプリケーションに参画して失敗した話

阿部健太郎 334

Sagemakerの精度検証

阿部健太郎 120

次世代LT会（SageMaker）

阿部健太郎 101

KH Coder 3 チュートリアル

HIGUCHI Koichi 735K

各ページのテキスト

AWS 若手LT大会 #2 機械学習ミリしらが作る Sagemaker canvasを使った大気汚染予測アプリ 2026/2/162025/09/30 阿部健太郎あべけん@食パン

自己紹介名前：阿部健太郎（食パン）年次：社会人3年目業務：ポータルサイトの保守運用 @Plainbread2009 @Plainbread2009 好きなサービス：Step Functions @Plainbread2009 2

今日話すこと・話すこと・SageMaker Canvasで作成したモデルの呼び方・推論モデルを使ったアプリケーションの構成・話さないこと・SageMaker Canvasの使い方とモデルの作り方・精度の話若手AWS なんでもLT会 #2で発表 3

目次 1.自己紹介 2.話すこと、話さないこと 3.SageMaker Canvasとは？ 4.アプリの構成 5.動作確認 6.まとめ 4

SageMaker Canvasとは・SageMaker（Studio）機械学習モデルの構築・学習・デプロイを一括で行えるサービスコードベースで高度なカスタマイズが可能・SageMaker Canvas ノーコードで機械学習モデルを作成・予測できるサービス GUIベースで操作でき、専門知識が少なくても利用できる特徴 SageMaker Studio Sagemaker Canvas 操作方法コードベース（Pythonなど）ノーコード（GUI）柔軟性高い（細かい制御が可能）低め（簡単に使えるが制限あり）学習・予測自由に設定可能自動で最適化される利用シーン本格的なML開発手軽な予測・分析 5

光化学オキシダント(Ox) 光化学オキシダント（Ox）は二次汚染物質二次汚染物質：大気中において、化学変化によって生成される発生源が特定しにくい。 Oxは以下のような問題 ①環境基準達成率が0.2%(2020年) 早急な対策がもめられている ②健康被害があるため大気汚染防止法で注意報や警報が定義。実測が基準値を超えてから発令されるため、回避が難しい出典：環境省・文部科学省 ECO学習ライブラリーより既存のモデルは短期的な予測は難しい！ SageMaker Canvasで予測を試してみる 6

アプリ構成・1時間おきに1時間先の濃度予測を実施・基準値を超えた時にSNSでアラートを通知入力データ取得予測とデータの保存予測濃度が一定以上で通知 7

モデルの呼び出し方（リアルタイム推論） ①リアルタイム推論リクエストとして受けたデータを順次処理する用途：API連携、即時返答が必要なアプリ・Real-Time Inference 常時インスタンスが起動しているいつでも実行でき、レイテンシが最短（ミリ秒台）その分起動している間従量課金となるため高額化の可能性・Serverless Inference 呼ばれたときだけ背後のコンテナが起動待機コストが0で呼ばれた時だけ課金されるコールドスタートがあり遅いことがある 8

モデルの呼び出し方（バッチ推論） ②バッチ推論リクエストとして受けたデータを順次処理する用途：大量データの一括処理、日次・月次バッチ・Batch Transform 「毎日0時に推論」など、スケジュールを組んで実施可能リアルタイムでは推論結果を確認することができない ③非同期推論非同期で推論を実行し、処理完了後に結果をS3に出力する用途：非同期処理、処理待ちが発生する処理・Asynchronous Inference 画像や動画解析等の重い推論に最適。大量ではなく重い 9

10.

モデルの呼び出し方（まとめ）リアルタイムリアルタイム推論サーバレス推論マイクロバッチバッチ非同期推論バッチ変換実行モード同期非同期非同期予測レイテンシー秒以下数秒～数分不定実行頻度可変可変可変 / 固定呼び出しモード連続ストリーム / APIコール推論データサイズユースケース小（ < 6MB）商品レコメンドイベントベースイベント / スケジュールベース中（ < 1GB）大（ > 1GB） PDFや契約書などの医療画像、動画などの大量ファイルの解析重い推論処理データサイズや推論時間が長いケース 10

11.

リアルタイム推論のやり方① ①エンドポイントを作る 11

12.

リアルタイム推論のやり方② ②Lambdaから呼ぶ。リアルタイム推論 S3からデータを取る同期リクエストバイト列 12

13.

バッチ推論のやり方① ①Lambdaから呼ぶ。バッチ推論 Lambda自体は結果を返さない後段にlambdaが必要になるバッチ推論 13

14.

まとめと今後・モデルのデプロイ方法は大きく2種類・リアルタイム推論とバッチ推論・要件に合わせて最適な選択を行う・私の要件だとサーバレスかバッチ？・デプロイするところまで来たので、アプリケーション化も進める 14

15.

ご清聴ありがとうございました 15