次世代LT会(SageMaker)

>100 Views

September 29, 25

スライド概要

AWS jr.championsのイベントで発表したスライド

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

第一回 次世代Jr.Champions LT大会 SageMaker Canvas モデルは作れた!でも予測ができない!? クォータの罠+α 2025/09/30 阿部健太郎

2.

自己紹介 名前:阿部 健太郎(あべ けんたろう) 所属:富士ソフト株式会社(3年目) 鈴木紗世さん(同期)の紹介 業務:ポータルサイトの保守運用(EC2上) クライアント証明書発行システム 趣味:ダーツ 資格:8冠 全冠まで(ANS,SCS,DOP,DAA+CloudOps) 修士(大気汚染のシミュレーション研究)

3.

目次 ・SageMaker Canvasって何? ・使ってみようと思ったきっかけ ・失敗談 ①クォータ制限 ②費用の問題(おまけ) ・まとめと感想

4.

SageMaker Canvasとは ・SageMaker(Studio) 機械学習モデルの構築・学習・デプロイを一括で行えるサービス コードベースで高度なカスタマイズが可能 ・SageMaker Canvas ノーコードで機械学習モデルを作成・予測できるサービス GUIベースで操作でき、専門知識が少なくても利用できる 特徴 SageMaker Studio Sagemaker Canvas 操作方法 コードベース(Pythonなど) ノーコード(GUI) 柔軟性 高い(細かい制御が可能) 低め(簡単に使えるが制限あり) 学習・予測 自由に設定可能 自動で最適化される 利用シーン 本格的なML開発 手軽な予測・分析

5.

使ってみようと思ったきっかけ 勉強会で行うLT会のネタ探し中 AWS + 機械学習 = SageMaker Canvas AWSの勉強しながら大学時代に諦めた 機械学習を用いた大気汚染の予測できるんじゃね?

6.

LTまでの準備 SageMaker Canvasで行こうと決めてからLTまで10日 ・最初の5日でモデル作成と予測精度の確認 ・次の5日でLT資料を作ろうと思っていた・・・・ 3地域(東京、神奈川、埼玉)のモデルをそれぞれ作成 大気汚染の予測に使いそうなデータ20年分(1日) 24時間×365日×20年×60地点=1000万行×8特徴量 =8000万セルの学習データ データも集めたし、モデル構築して、 後は予測と精度検証するだけ!!。。。

7.

事件発生!全然間に合わない ①モデルを作るのに1.5日を要する。(張り切りすぎた) ②モデルを使った予測をしてみると予期せぬエラーが発生 (・・? ググると、予測にはクォータの緩和申請が必要 クォータの緩和に4,5日 クォータを蔑ろにしたら×、 実際に使うときはクォータの申請を先にする

8.

おまけ!(後日談) Sagemaker Canvasはモデル構築時に使用される インスタンス時間に対する従量課金 24時間×365日×20年×60地点=1000万行×8特徴量 =8000万セルの学習データ 3地域分のモデル 大きいサイズのインスタンスが36時間稼働しっぱなし 何も考えず大量のデータでモデル構築した結果!! 使用料金が8万円 ほぼすべて SagemakerCanvas

9.

教訓とまとめ ・Sagemaker Canvasをつかうときは、 緩和申請やモデルの作成時間を検討 ・クォータ馬鹿にならん ・費用の予測もちゃんとしよう

10.

ご清聴ありがとうございました