>100 Views
September 29, 25
スライド概要
AWS jr.championsのイベントで発表したスライド
第一回 次世代Jr.Champions LT大会 SageMaker Canvas モデルは作れた!でも予測ができない!? クォータの罠+α 2025/09/30 阿部健太郎
自己紹介 名前:阿部 健太郎(あべ けんたろう) 所属:富士ソフト株式会社(3年目) 鈴木紗世さん(同期)の紹介 業務:ポータルサイトの保守運用(EC2上) クライアント証明書発行システム 趣味:ダーツ 資格:8冠 全冠まで(ANS,SCS,DOP,DAA+CloudOps) 修士(大気汚染のシミュレーション研究)
目次 ・SageMaker Canvasって何? ・使ってみようと思ったきっかけ ・失敗談 ①クォータ制限 ②費用の問題(おまけ) ・まとめと感想
SageMaker Canvasとは ・SageMaker(Studio) 機械学習モデルの構築・学習・デプロイを一括で行えるサービス コードベースで高度なカスタマイズが可能 ・SageMaker Canvas ノーコードで機械学習モデルを作成・予測できるサービス GUIベースで操作でき、専門知識が少なくても利用できる 特徴 SageMaker Studio Sagemaker Canvas 操作方法 コードベース(Pythonなど) ノーコード(GUI) 柔軟性 高い(細かい制御が可能) 低め(簡単に使えるが制限あり) 学習・予測 自由に設定可能 自動で最適化される 利用シーン 本格的なML開発 手軽な予測・分析
使ってみようと思ったきっかけ 勉強会で行うLT会のネタ探し中 AWS + 機械学習 = SageMaker Canvas AWSの勉強しながら大学時代に諦めた 機械学習を用いた大気汚染の予測できるんじゃね?
LTまでの準備 SageMaker Canvasで行こうと決めてからLTまで10日 ・最初の5日でモデル作成と予測精度の確認 ・次の5日でLT資料を作ろうと思っていた・・・・ 3地域(東京、神奈川、埼玉)のモデルをそれぞれ作成 大気汚染の予測に使いそうなデータ20年分(1日) 24時間×365日×20年×60地点=1000万行×8特徴量 =8000万セルの学習データ データも集めたし、モデル構築して、 後は予測と精度検証するだけ!!。。。
事件発生!全然間に合わない ①モデルを作るのに1.5日を要する。(張り切りすぎた) ②モデルを使った予測をしてみると予期せぬエラーが発生 (・・? ググると、予測にはクォータの緩和申請が必要 クォータの緩和に4,5日 クォータを蔑ろにしたら×、 実際に使うときはクォータの申請を先にする
おまけ!(後日談) Sagemaker Canvasはモデル構築時に使用される インスタンス時間に対する従量課金 24時間×365日×20年×60地点=1000万行×8特徴量 =8000万セルの学習データ 3地域分のモデル 大きいサイズのインスタンスが36時間稼働しっぱなし 何も考えず大量のデータでモデル構築した結果!! 使用料金が8万円 ほぼすべて SagemakerCanvas
教訓とまとめ ・Sagemaker Canvasをつかうときは、 緩和申請やモデルの作成時間を検討 ・クォータ馬鹿にならん ・費用の予測もちゃんとしよう
ご清聴ありがとうございました