1K Views
March 03, 23
スライド概要
◆無料説明会・ミニ体験会URL
https://peatix.com/event/3508855/view
※詳しいカリキュラムのご紹介や機械学習講座のミニ体験会となっております。ご興味がある方はまずはこちらの【無料説明会・ミニ体験会】へお申込みください。
◆2023年5月開講 『データサイエンティスト養成講座』お申込みURL
https://peatix.com/event/3508941/view
※本講座は株式会社ワークシフト研究所およびフレイ・アンド・テクノロジーズ株式会社との共同開催となります。
フレイ・アンド・テクノロジーズ株式会社 資料共有です。
2023年5月開講(全6日間) 『データサイエンティスト養成講座』 (説明会・ミニ体験会) ◇説明会・ミニ体験会日時 ・2023/3/29(水)12:00-13:00 ・2023/4/05(水)12:00-13:00 ・2023/4/14(金)12:00-13:00 ・2023/4/21(金)17:00-18:00 ・2023/5/10(水)12:00-13:00 ※いずれも同じ内容です。録画視聴参加もあります!
お申込みURL ◆無料説明会・ミニ体験会URL https://peatix.com/event/3508855/view ※詳しいカリキュラムのご紹介や機械学習講座のミニ体験会となっております。 ご興味がある方はまずはこちらの【無料説明会・ミニ体験会】へお申込みください ◆2023年5月開講 『データサイエンティスト養成講座』お申込みURL https://peatix.com/event/3508941/view ※定価:359,000円のトレーニング講座をモニター開催価格として特別価格(158,000円)にて開催いたします。 ※ワークシフト研究所・フレイATの特定のイベント参加者には上記より割引コードあり(対象者には別途ご連絡しております) ※法人様については銀行振込(請求書払い)も可能です。ワークシフト研究所 事務局([email protected])までご連絡下さい。 ※本講座は株式会社ワークシフト研究所およびフレイ・アンド・テクノロジーズ株式会社との共同開催となります。 ※お申込み締切:2023年5月14日(日) 23:59まで 2
2023年5月開講 「データサイエンティスト養成講座」 ✓ 機械学習アルゴリズムや高度なデータ分析テクニックを集中して学ぶ実践講座(オンライン開催) を開講します。デジタル変革・A Iプロジェクトに求められるスキルを備えた人材を育成します。 ✓ 演習ではノーコード機械学習ソフトを利用します(プログラミング不要)ので、 敷居が高いと感じている方でも『本格的な内容を学べる希少な講座』です。 ✓ 最終課題では実践を模したデータ分析コンペを行います。現役のデータサイエンティストと 同等の予測モデルの精度向上・データ分析課題にチャレンジいただきます! ✓ 「データサイエンティスト養成講座」の詳しいカリキュラムのご紹介と導入部分の講義、そして 演習の中身をお見せする説明会・ミニ体験会を開催いたします。 ご興味がある方はまずは【無料説明会・ミニ体験会】へお申込みください。 3
「データサイエンティスト養成講座」の特徴・こんな方へオススメ! ✓ 本格的にデータサイエンティストを目指して集中して学べる ※1 ✓ プログラミングの知識ゼロでも大丈夫!(ノーコードツール利用) ※2 ✓ 機械学習の事前知識は不要。数学苦手な方、文系でも大丈夫!(図・イメージで解説) ✓ 手を動かして学ぶので、しっかりと身につきます!(ハンズオン演習多め)※3 ✓ 独学で勉強されようとして挫折した方、ビジネス職の方などどなたでも参加可能です ※1 他の研修会社だと、20コマ以上・6ヵ月相当のカリキュラムと同等(機械学習書籍5-6冊分に相当) ※2 ノーコード機械学習ソフト:Python等のプログラミング無しで演習を行います。 ※3 データ可視化~予測モデル構築~モデル評価~予測精度向上手法まで、 実務でよく発生する問題点やデータサイエンスが用いる高度な手法も多く解説・演習 4
トレーニング日程・フォローアップ(オンライン開催) ◇トレーニング開催 全6日間(9:30~17:00想定) ・2023/5/21(日)9:30~17:00(講座1日目) ・2023/6/11(日)9:30~17:00(講座3日目) ・2023/7/09(日)9:30~17:00(講座5日目) ・2023/5/28(日)9:30~17:00(講座2日目) ・2023/6/25(日)9:30~17:00(講座4日目) ・2023/7/30(日)9:30~17:00(講座6日目) ◇フォローアップ日 2時間×5回(予約不要・入退出自由) ※機械学習ソフトの操作方法や講義Q&Aのフォローアップ日を別途準備しております。 ※ご質問がある方、業務都合などで講座当日に欠席・一部欠席された方などご活用ください。 ※講義スライドはすべてPDFで配布。メールによるQ&Aはいつでも受付します。(手厚くフォローします) ◇グループ課題発表:20~40時間程度の自習・グループワークを想定 ◇講義内容・演習内容はすべて録画しており、開催日より180日間は録画の視聴が可能です。 5
受講環境・想定参加者・トレーニング修了証 ◇ツール・受講環境 ✓ ノーコード機械学習ソフトウェア:RapidMiner(Free版)、PCのメモリ8G以上を推奨 ✓ オンライン講義:Zoom ✓ 最終グループ課題についてはPython、Rなどプログラミング言語・ツールの使用は自由 ◇想定参加者 ✓ 経営企画・営業・経理・オペレーションなどビジネス職の方、社内SE・エンジニアなど技術者の方 ✓ ITエンジニア・コンサルタントなど顧客に提案するベンダ担当の方 ✓ その他、学生・社会人など事前の知識・前提条件はありません、どなたでも受講可能です ◇トレーニング修了書の発行 ✓ 講座への80%以上の出席(動画視聴参加含む)・最終課題:データ分析レポートの提出者には、 「データサイエンティスト養成講座」修了証を発行いたします 6
2023年5月開講(全6日間) 『データサイエンティスト養成講座』 本格的な機械学習・データ分析テクニックを 集中して学ぶ実践講座!
機械学習・データサイエンス 担当講師紹介 ◇講師:高木 宏明 ◇講師からのメッセージ 実務・現場 ✓ 理論だけではなく、実務で多く発生するビジネス上の課題 についても解説します ✓ マーケティングや製造など、ビジネス上で機械学習がどの ように利活用されているか、事例を多く話すことで理論と 実ビジネスとの紐づけを意識して講義しています 理解・習得 データ分析コンサルタント・ワークシフト研究所講師・研究員 慶應義塾大学大学院 経営管理研究科 「データサイエンス」 非常勤講師 (2019年度1学期~2023年度1学期) 青山学院大学 社会情報学部 「データマイニング」「データマイニング演習」 非常勤講師 (2018,2020,2021年度) 国立高松高専専攻科 機械電気システム工学専攻 修了 慶應義塾大学大学院 経営管理研究科 修了(ビジネススクール・MBA) 大企業を中心としてBI・機械学習・データ処理基盤の提案・分析相 談に長年従事。機械学習トレーニング教材の開発・講師も務め、企 業・大学向けの講義・講演多数(毎年、2~300名以上の学生・社会 人向けにへ、データサイエンス講義を行っております) ✓ 機械学習アルゴリズムがどのように予測を行っているのか 体感的に分かりやすい解説・演習を心がけています ✓ データサイエンス=問題解決の道具というスタンスで講義 します(数学・ITが苦手な受講生でも理解し使えることが目標) ✓ 手厚くフォローもいたしますので安心してご参加ください 8
詳細カリキュラム 1日目 ◇イントロダクション:機械学習の全体像 ◇AI基礎入門(解説のみ) ✓ データ分析者に求められるスキルセット ✓ 弱い AI・強い AI ✓ 教師あり学習・教師なし学習・強化学習 ✓ 探索・推論・知識表現 ✓ 機械学習の目的・メリット ✓ フレーム問題・シンボルグラウンディング問題 ✓ 予測精度と説明性・解釈性の関係 ✓ Deep Learningを中心としたAIの発展概況 ✓ 生成系AIとホワイトカラー・クリエイティブ職への影響 ◇データ基礎、教師あり学習:クラス分類 ✓ 強化学習とオペレーション職の協働 ✓ データ型、尺度 ✓ 目的変数と説明変数 ✓ 基本統計量、ヒストグラム、箱ひげ図 ✓ データ尺度、相関係数 ✓ アルゴリズム概説:決定木・K-NN ✓ ハンズオン演習:データ可視化 ✓ ハンズオン演習:アヤメの花の分類 ✓ ハンズオン演習:予測モデルの学習と適用 ✓ 予測精度検証:クロスバリデーション 9
詳細カリキュラム 2日目 ◇教師あり学習:クラス分類(続き) ◇アンサンブル学習 ✓ アルゴリズム解説:決定木・K-NN・SVM・ ✓ アンサンブル学習:Vote、バギング、ブースティング、スタッ Deep Learningなど ✓ ハンズオン演習:購買予測 ✓ ハンズオン演習:センサーデータによる分類 ✓ 予測精度検証:クロスバリデーション ✓ 1つ抜き検証とk分割検証の比較 ✓ コンフュージョンマトリックスの見方 ✓ クラス分類評価指標:Accuracy・Recall・Precision等 ✓ オーバーフィッティングとアンダーフィッティング キング ✓ Tee系アンサンブルモデル:Random Forest、Gradient Boosted Trees ◇ハイパーパラメータ最適化 ✓ ハイパーパラメータ最適化:グリッドサーチ ✓ アルゴリズム毎のハイパーパラメータまとめ ✓ グリッドサーチとランダムサーチ ✓ ハンズオン演習:ハイパーパラメータ最適化演習 10
詳細カリキュラム 3日目 ◇教師あり学習:回帰 ◇変数選択 ✓ 線形回帰アルゴリズム解説 ✓ 変数の数が多い場合の問題点 ✓ 回帰評価指標:MSE・RMSE・R2 ✓ 変数選択:ステップワイズ法 ✓ 単回帰・重回帰・多項式回帰・交互作用項 ✓ 最良部分集合選択とステップワイズ法の比較 ✓ ハンズオン演習:テスト点数予測 ✓ ハンズオン演習:変数選択 ✓ ハンズオン演習:住宅価格予測 ✓ 直接推定と間接推定、AIC、Tree分割基準 ✓ ハンズオン演習:年収予測 ✓ データの非線形性とノンパラメトリック回帰 ◇正則化 ✓ クラス分類アルゴリズムの回帰への適用 ✓ 正則化:リッジ・ラッソ・エラスティクネット ✓ 回帰における重要注意点 ✓ ハンズオン演習:罰則項の変化と回帰係数の変化 ・予測範囲:内挿・外挿 ✓ ラッソ回帰による変数選択 ・多重共線性の影響と確認手法 ・外れ値・異常値が予測モデルをどう歪めるのか? 11
詳細カリキュラム 4日目 ◇前処理・特徴量設計入門 ◇グループ課題説明・演習 ✓ 変数選択・変数除去(ID・疑似相関・リーク情報) ✓ グループ毎に各自演習・グループワーク ✓ 2値分類の多値分類(One vs ALL) ✓ 連続データの離散化(ビンニング) ✓ カテゴリ変数の数値化(ワンホットエンコーディング) ✓ 欠損値:MCAR・MAR・MNAR ✓ 欠損値補完の手法 ✓ 異常値対応 ✓ データスケール変換(レンジ・Z変換・対数変換) ✓ 不均衡データ対応 ✓ アップサンプリング・ダウンサンプリング・SMOTE ✓ Threshold(閾値)による予測結果の補正 ✓ ダウンサンプリング+バギング ✓ データのスパース性 ✓ 次元圧縮:PCA ✓ 探索的データ分析と特徴量設計 12
詳細カリキュラム 5日目 ◇Deep Learningによる画像分類入門(MNIST) ◇情報基礎理論・マルチメディア入門(解説のみ) ✓ パーセプトロン、重み学習イメージ、活性化関数 ✓ デジタル・アナログ変換、情報源符号化 ✓ フォワードプロパゲーション・バックプロパゲー ション ✓ データ構造(リスト・配列・木構造) ✓ ハンズオン演習:プレイグラウンドで遊ぼう ✓ データ量の増大:分散・並列コンピューティング重要性 ✓ MNISTデータ補足:画像のデータ構造 ✓ NoSQLの種類(キーバリュー・ワイドカラム・ドキュメント・グラフ) ✓ 設計要素:層数・ノード数・活性化関数・正則化・ ドロップアウト率・ラーニングレート ✓ ハンズオン演習:手書き文字分類(MNIST) ✓ テキスト処理・音声処理・画像処理 ◇グループ課題演習 ✓ グループ毎に各自演習・グループワーク ◇次元圧縮 ✓ 主成分分析:PCA ✓ その他次元圧縮アルゴリズムサンプル 13
詳細カリキュラム 6日目 ◇教師なし学習入門 ◇グループ課題発表 ✓ 階層的クラスタリングと非階層的クラスタリング ✓ 各グループ課題発表・フィードバック ✓ k-meansクラスタリング ✓ ハンズオン演習:Irisデータとクラスタリング比較 ◇総まとめ講義:データ分析プロセス(CRISP-DM) ✓ ハンズオン演習:都市別の飲酒傾向分析 ✓ 課題内容の振り返り・解説 ✓ アソシエーション分析(併売分析) ✓ Kaggleの多重投稿対策 ✓ アソシエーション指標:Support・Confidence・Lift ✓ データ分析プロセス(CRISP-DM)毎の注意点 ✓ ハンズオン演習:スーパーマーケットの併売分析 ✓ よい予測モデル?:予測精度、説明性・解釈性、 ロバスト性、計算量、課題解決 ◇データベース入門(解説のみ) ✓ システム実装:計算量問題、KPIモニタリングと改善 ✓ データベースとは? ✓ おすすめ書籍の紹介 ✓ マスタテーブルとトランザクションテーブル ✓ データベース操作言語SQL・SQLクエリの例 ✓ データ分析とデータハンドリングの重要性 ✓ データ処理基盤:データ処理パイプライン・データレイク・ DWH 14
ノーコード機械学習ソフト 画面サンプル① ※プログラミング未経験者でも簡単に予測モデル構築が可能 15
ノーコード機械学習ソフト 画面サンプル② ※パイパーパラメータ最適化(グリッドサーチ)の例 16
ノーコード機械学習ソフト 画面サンプル③ ※データ可視化機能の例 17
教材サンプル① 18
教材サンプル② 19
受講いただいた方からの声・感想 機械学習の概要・イメージを習得することができ、また演習を通して実際の予測モデル構築の流れも学ぶことができました。 この分野は初の講座でしたが、データ分析のハードルが下がりとても勉強になりました。 かなり広い分野を網羅して学ぶことが出来てよかったです。演習も分かりやすかった。 入門書や雑誌の特集を読んでなんとなく理解していたことが、ノーコードツールを使って自分でできたことが面白かったです。 機械学習アルゴリズムの具体的な利用イメージがつくようになりました。 講師の説明が分かりやすく、ハンズオンの演習もよかった。 データ分析だけでなく、ビジネス上の課題やDXプロジェクトの実務で発生する問題など小話が興味深かった。 アルゴリズムの解説やツールの使い方もフォローいただき助かりました。す。 初心者でしたが、講義と演習のバランスが良く理解が進みました。 興味ある分野だったのでこれまで独学で勉強もしていましたが、勘違いしていた点など改めて勉強になりました。 独学である程度勉強されている方にもおススメできる講座だと思います。 かなり丁寧に講義をすすめて頂いたので理解できました 教師あり、教師なしアルゴリズムの違いやデータ分析の目的、予測精度向上テクニックなど多くの点を学べました。 また、私は文系卒ということもありPythonで独学しようとしてプログラミングで挫折していましたが、今回はバッチリついて行けました。 20