マンガでわかる機械学習 6章

582 Views

August 15, 23

#機械学習 #教師なし学習 #Machine Learning #Unsupervised Learning #Clustering #Matrix Factorization #Factorization Machine

スライド概要

荒木雅弘

@MasahiroAraki

スライド一覧

機械学習・音声認識・プログラミングに関する書籍を執筆しています。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

ChatGPT 研修用資料 1. ChatGPT の仕組みと基本的な使い⽅

chatgpt

荒木雅弘 4.9K

ChatGPT 研修用資料 3. デザイン思考を題材としたプロンプトエンジニアリングの実践

chatgpt デザイン思考

荒木雅弘 4.2K

プログラミング〈新〉作法 2. C言語からはじめよう

プログラミング

荒木雅弘 3.9K

ChatGPT 研修用資料 2. プロンプトエンジニアリングの概要

chatgpt

荒木雅弘 3.5K

プログラミング〈新〉作法 1. はじめに

プログラミング

荒木雅弘 2.7K

フリーソフトではじめる機械学習入門 (第2版) 第14章

機械学習半教師あり学習

荒木雅弘 2.6K

各ページのテキスト

6章教師なし学習 p.169 3コマ目 • 荒木雅弘(著), 渡まかな(作画), ウェルテ(制作) : 『マンガでわかる機械学習』（オーム社, 2018年） • サポートページ

6章のストーリー • 清原の所属する健康福祉課では、市内の高齢者に対して内容をカスタマイズしたメールマガジンを送っている • 誰にどのような内容を送るかというノウハウは定年間近の課長が持っているが、ルール化できず誰も引き継げない • 清原は教師なし学習でこの問題に取り組む

教師なし学習 • 教師なし学習とは • 正解情報が付いていないデータに対して、何らかの規則性を発見する手法 • 規則がカバーする範囲によって問題が分かれる • データ全体をカバー：クラスタリング • データの部分集合をカバー：行列分解

クラスタリング • クラスタリングとは • 同一の性質を持つと見なされるデータのまとまりを見つけること例）マーケティングでのユーザグループ発見 • クラスタリングの手法 • 階層的手法 • ボトムアップ的にデータをまとめてゆく • 分割最適化手法 • トップダウン的にデータ集合を分割してゆく

階層的クラスタリング • 1データ1クラスタから始めて、近いクラスタを合併してゆく • 近さの基準の選択によって、結果が異なる

分割最適化クラスタリング • k-means法 • k個の平均値をランダムに決めるところから始めて、所属するデータを基準に適切な位置を決める

行列分解 • 推薦システムの基本手法 • サイズが大きく、ほとんど値が埋まっていないデータが対象大きな値になりそうな要素を予測ユーザN人商品M種類

行列分解似ている商品は、似ているベクトルで表現される • 行列の低次元分解商品情報M×K行列商品M種類ユーザN人 × = U ユーザ情報N×K行列振る舞いが似ているユーザは、似ているベクトルで表現される VT

行列分解 • 低次元分解の解釈 𝑥𝑛𝑚 = 𝑤1𝑛 𝑣1𝑚 + 𝑤2𝑛 𝑣2𝑚+...+𝑤𝐾𝑛𝑣𝐾𝑚 𝑤1𝑛 女性．．． 𝑣1𝑚 𝑤𝐾𝑛 甘いもの好きユーザN人潜在因子K個 𝑣𝐾𝑚 商品M種類

10.

行列分解の方法 • 元の行列との誤差を最小化 • 問題点：値が埋まっていないところを0と解釈 • 値が埋まっているところだけで最小化 • 正則化が必要

11.

Factorization Machine • 別途入手可能な補助情報を用いることができる疎な行列予想したい値y （ユーザiが商品jを買うか）買い物好き？商品M種類ユーザiのバイアスユーザに関する補助情報ユーザ N 人商品に関する補助情報密な行列定数項よく売れる？商品jのバイアス交互作用：潜在因子からなるk次元ベクトルの内積補助情報を含めた任意の要素間で定義可能