深層学習の理論

494 Views

March 16, 23

#深層学習 #機械学習 #ニューラルネットワーク #人工ニューロン #活性化関数

スライド概要

学内セミナーで使用したニューラルネットワークに関する資料。
機械学習に関する前提知識、ニューラルネットワークの構造、学習方法などをまとめた。

*slideshare（https://www.slideshare.net/ssuser4c06f8/ss-256527379）からの移植

Komiya

@misya11p

スライド一覧

主に深層学習に興味があります

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

混合ガウスモデルの理論と実装

機械学習混合ガウスモデル emアルゴリズム

Komiya 36.5K

GPT-1の論文を読もう

言語モデル gpt transformer

Komiya 11.8K

強化学習の基本と簡単な実装

強化学習機械学習

Komiya 3.6K

ライトモードvsダークモード～目にいいのはどっち？～

ライトモードダークモード外観モード

Komiya 2.8K

主成分分析

機械学習主成分分析次元削減

Komiya 2.5K

GANの簡単な理解から正しい理解まで

深層学習生成モデル gan

Komiya 1.4K

各ページのテキスト

2023/3/15 DDoS2023春ニューラルネットワーク武蔵野⼤学脱初⼼者データサイエンスオンラインセミナー 2023春⼩宮和真 misya11p 武蔵野⼤学データサイエンス学部 2年 @ds33miya

2023/3/15 DDoS2023春⽬次 1. ニューラルネットワークとは 2. ニューラルネットワークの構成 3. ニューラルネットワークの学習 4. ニューラルネットワークの実装 1

2023/3/15 DDoS2023春 1. ニューラルネットワークとは 2

2023/3/15 1. ニューラルネットワークとは DDoS2023春ニューラルネットワーク⼈間の脳の神経回路を模した数理モデル数理モデルある現象を数式で記述したもの．ここでは関数と捉えておくと良い．なんらかの数字数理モデルなんらかの数字 3

2023/3/15 1. ニューラルネットワークとは DDoS2023春機械学習モデル⼊⼒に対して適切な出⼒が⾏えるように学習できる数理モデルなんらかの数字機械学習モデルいい感じの数字 4

2023/3/15 1. ニューラルネットワークとは DDoS2023春機械学習モデル上⼿く学習させると⾊々なタスクがこなせる様になるタスク入力例出力例画像分類猫の画像猫（テキスト）将棋盤面次の手会話質問回答 5

2023/3/15 1. ニューラルネットワークとは DDoS2023春機械学習モデルモデルへの⼊出⼒は数値である必要がある →あるタスクに機械学習モデルを適応させたい場合，数値として表せる⼊出⼒を考えることが必須数値化の例：画像画像は画素（単⾊の正⽅形）の集まりで，⾊はカラーコードなどから数値化できる 0 2 0 1 0 2 3 3 2 1 0 1 2 6 9 1 0 8 2 2 6 0 2 1 1 6

2023/3/15 DDoS2023春 1. ニューラルネットワークとは機械学習機械学習モデルを学習させること → ⼊⼒に対して適切な出⼒を⾏える様にすること機械学習モデルは関数であるため，機械学習の⽬的はいい関数を得ることと⾔える 7

2023/3/15 1. ニューラルネットワークとは DDoS2023春機械学習関数の内部の式は事前に決まっている（⼈間が決める）例えば以下の式 𝑓 𝑥 = 𝑎𝑥 + 𝑏 しかし，この式の中の具体的な値（𝑎, b）は決まっていないこの値（𝑎, b）をパラメータと呼び，適切なパラメータをデータから⾃動で求めることを機械学習と呼ぶ 8

10.

2023/3/15 DDoS2023春 1. ニューラルネットワークとはニューラルネットワーク NN（ニューラルネットワーク）は機械学習モデルの⼀種で，以下の様な特徴を持つ • ⼈間の脳の神経回路を模して作られる • 表現⼒が⾼い • 拡張性・汎⽤性が⾼いこの様な特徴があってか，多様な使い⽅が考案されており，近年話題のAIには全てNNが使われていると⾔っても過⾔ではない 9

11.

2023/3/15 DDoS2023春 2. ニューラルネットワークの構造 10

12.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春ニューラルネットワークの構造具体的な構造を⾒ていく．イメージは以下．入力出力「ネットワーク」って感じがするね 11

13.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春⼈⼯ニューロン NNを構成する要素．さっきの図の●が⼈⼯ニューロン．この⼈⼯ニューロンも⼀つの機械学習モデルと⾒ることができ，⼊⼒に対してパラメータに基づいた出⼒を⾏う⼈⼯ニューロンは複数の数値を受け取り，⼀つの数値を返す入力1 入力2 : 人工ニューロン出力入力𝑛 12

14.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春⼈⼯ニューロン各⼊⼒に重みをかけたものの和にバイアスを⾜した数を活性化関数と呼ばれる関数にかけて出⼒する重みとバイアスは⼈⼯ニューロンにおけるパラメータである⼈⼯ニューロンは以下の式で表せる 𝑦 = ℎ(𝑥 * 𝑤 + 𝑏) ⼊⼒：𝑥 = 𝑥! , 𝑥" , ⋯ , 𝑥# 重み：w = 𝑤! , 𝑤" , ⋯ , 𝑤# バイアス：𝑏 活性化関数：ℎ 𝑥 $ 𝑤は内積で 𝑥!𝑤! + 𝑥"𝑤" + ⋯ + 𝑥# 𝑤# と同じ 13

15.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春⼈⼯ニューロングラフにすると以下⼊⼒𝑥$ に対応する重みw$ をこんな感じで書くことが多い気がする 𝑥! 𝑥" : x# w! w" 𝑦 = ℎ(𝑥 ⋅ 𝑤 + 𝑏) 𝑦 w# 14

16.

2023/3/15 DDoS2023春 2. ニューラルネットワークの構造パーセプトロン⼈⼯ニューロンの活性化関数にステップ関数を使⽤したものステップ関数グラフが階段状になる関数の総称．ただここでは以下の関数に限定する． 1 (𝑥 ≥ 0) 𝑦=0 (𝑥 < 0) この関数はヘヴィサイドの階段関数とか単位ステップ関数とか呼ばれる 15

17.

2023/3/15 DDoS2023春 2. ニューラルネットワークの構造⼈⼯ニューロンとパーセプトロンこの資料では，活性化関数にステップ関数を使⽤した⼈⼯ニューロンをパーセプトロンと定義した．ただ⾊んな記事を⾒ていると，⼈⼯ニューロンをパーセプトロンと呼んでいる⼈もいる．またこの後説明するニューラルネットワークは，この資料でいう⼈⼯ニューロンを組み合わせたモデルであるが，多層パーセプトロンとも呼ばれる．つまりこの⼆つの⾔葉の違いは定義できない．辞書の中で定義はあるかもしれないが，現状⼈によって微妙に解釈が異なってしまっている以上，そこに敏感にならない⽅が良い気がする． 16

18.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春ニューラルネットワーク複数の⼈⼯ニューロンを組み合わせたモデル．先ほどの図を再掲．入力⼀つ⼀つの●が⼈⼯ニューロンニューロンのネットワークなのでニューラルネットワーク出力 17

19.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春ニューラルネットワーク演算の流れは簡単で，各⼈⼯ニューロンの出⼒が次の⼈⼯ニューロンに渡っていくだけ．最終的に流れてきた値がそのNNの出⼒． 𝑦* 𝑦+ 𝑥 入力 𝑦* 𝑦+ 𝑥 出力 𝑦* 18

20.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春ニューラルネットワーク NNでは層を⼀つの単位として考える．層は図の縦⼀列を指す．最初の層は⼊⼒層，最後の層は出⼒層，それ以外の層は中間層または隠れ層と呼ぶ．入力出力 19

21.

2023/3/15 DDoS2023春 2. ニューラルネットワークの構造ニューラルネットワーク中間層が2層以上あるものはディープニューラルネットワーク（DNN）と呼ぶ． DNNの学習をディープラーニングといい，これを和訳したものが深層学習である． Deep! 入力出力 20

22.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春全結合層⼈⼯ニューロンを⼀列に並べたものを層と述べたが，厳密には全結合層と呼ぶ．これはNNを構成する最も基本的な層である．全結合層も⼀つのモデルとしてみることができる入力全結合層出力 21

23.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春全結合層⼊出⼒にはベクトルを想定するある全結合層の⼈⼯ニューロンの数を𝑚，⼀つ前の層の⼈⼯ニューロンの数を𝑛 とすると，⼊⼒は𝑛次元ベクトル，出⼒は𝑚次元ベクトルとなる． 𝑥! 𝑦! 𝑥" 𝑦" : 𝑥# 全結合層 : 𝑦$ 22

24.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春全結合層全結合層全体で⾒ると，𝑛×𝑚個の重みと𝑚個のバイアスを持つ．これらが全結合層のパラメータとなる．全結合層は以下の式で表せる 𝑦 =𝑥*𝑊+𝑏 𝑥: ⼊⼒ベクトル（𝑚次元） 𝑦: 出⼒ベクトル（𝑛次元） 𝑊: 各⼈⼯ニューロンの重みを並べた𝑛×𝑚⾏列 𝑏: 各⼈⼯ニューロンの重みを並べた𝑚次元ベクトル 23

25.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春活性化関数活性化関数は⼈⼯ニューロンに対して定めるものだったが，NNでは活性化関数も⼀つの層として捉える入力入力層全結合層活性化関数全結合層活性化関数出力 24

26.

2023/3/15 DDoS2023春 2. ニューラルネットワークの構造活性化関数活性化関数には⾮線形な関数を⽤いる⾮線形 𝑦 = 𝑎𝑥 + 𝑏の様な⼀次式で表せないもの．逆に表せるものは線形という．線形な関数を⽤いた場合，どれだけ層を増やしてもNN表現⼒はただ⼀つの全結合層と変わらない 25

27.

2023/3/15 DDoS2023春 2. ニューラルネットワークの構造活性化関数 ReLU (Rectified Linear Unit) 最もよく使われる活性化関数 𝑥 (𝑥 ≥ 0) 𝑦=0 (𝑥 < 0) 26

28.

2023/3/15 DDoS2023春 2. ニューラルネットワークの構造活性化関数 sigmoid ステップ関数を滑らかにしたもの値の範囲を制限したい時とかに使う 1 𝑦= 1 + 𝑒 -. 27

29.

2023/3/15 DDoS2023春 2. ニューラルネットワークの構造活性化関数 tanh (Hyperbolic Tangent) sigmoidを-1~1に拡張したものこっちを使う⽅が上⼿くいく場⾯がある 𝑒 . − 𝑒 -. 𝑦= . 𝑒 + 𝑒 -. 28

30.

2023/3/15 2. ニューラルネットワークの構造 DDoS2023春活性化関数 Softmax 要素の総和が1になる様に調整するもの．分類を⾏う際の出⼒層に設定し，各要素の値を対応するクラスに属する確率とする． exp(𝑥/ ) 𝑦/ = ∑0 exp(𝑥0 ) 29

31.

2023/3/15 DDoS2023春 3. ニューラルネットワークの学習 30

32.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春ニューラルネットワークの学習機械学習における学習とは，パラメータを最適化することである NNでは各⼈⼯ニューロンが別々のパラメータ（重み，バイアス）を持っている． NNの学習ではこれらを全て最適化する．入力 ! w!! " w!! " w!" ! w!" ! w!# " w"! ! w"! ! w"" ! w"# " w"" 出力 " w#! " w#" 31

33.

2023/3/15 DDoS2023春 3. ニューラルネットワークの学習最適化問題ある関数を最⼤または最⼩にする変数を求める問題．この関数は⽬的関数と呼ぶ． NNの学習を最適化問題に落とし込むとイイ感じになる．以下の様に考える． • ⽬的関数：NNの精度 • 変数：NNのパラメータこうすると，NNの学習を「NNの精度を最⼤にするパラメータを求める」という最適化問題として捉えられる 32

34.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春損失 NNの精度を表す指標の⼀つ．誤差ともいう．以下の流れに従って算出する． 1. NNに⼊⼒するデータ（値）の例を⽤意する 2. それを⼊⼒した時に出てきてほしい値を正解値として定める 3. NNに⼊⼒例を⼊⼒し，出⼒値を求める 4. 出⼒値と正解値との差を求める入力 1 NN 出力損失正解 3 4 2 33

35.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春損失関数損失を求める関数⼆つのベクトルの差を表す⽅法は⾊々ある NN 出力損失関数損失正解 34

36.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春損失関数平均⼆乗誤差 (MSE - Mean Square Error) 差の2乗の平均 2 1 𝐸 = ; 𝑦0 − 𝑡0 𝑛 + 01* 𝑦: 出⼒ 𝑡: 正解 35

37.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春損失関数⼆乗和誤差 (SSE - Sum of Squared Error) 差の⼆乗の和．2で割って微分が綺麗になる様にしたものが多いかも． 2 1 𝐸 = ; 𝑦0 − 𝑡0 2 + 01* 𝜕𝐸 = 𝑦$ − 𝑡$ 𝜕𝑦$ 36

38.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春損失関数交差エントロピー (Cross Entropy) ⼆つの確率分布の距離を表す 𝐸 = − ; 𝑡0 log 𝑦0 0 分類のタスクを⾏うときに使う．その場合𝑡は基本one-hotベクトルなので，正解のクラスをi とすると以下と同じ意味になる． 𝐸 = − log 𝑦0 37

39.

2023/3/15 DDoS2023春 3. ニューラルネットワークの学習勾配法最適化問題を解くアルゴリズムの⼀つ関数の最⼤値を求める場合は勾配上昇法，最⼩値を求める場合は勾配降下法となる．NNの学習では先ほどの損失を最⼩にする問題を考えるので後者．⽬的関数を変数で微分すれば傾きが分かる→傾きが分かるなら⼤きくする・⼩さくする⽅向が分かるよねという発想この「傾き」のことをここでは勾配と呼ぶ 38

40.

2023/3/15 DDoS2023春 3. ニューラルネットワークの学習勾配法以下の⼿順に従って最適化する 1. 2. 3. 4. 変数を初期化する（乱数などで初期値を決める）その地点の勾配を求める勾配に合わせて変数を少し変化させる 2, 3を適当に繰り返す 39

41.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春勾配法例：以下の関数𝑓(𝑥)を最⼩にする変数𝑥を求める 𝑓(𝑥) = 𝑥 + 40

42.

2023/3/15 DDoS2023春勾配法 3. ニューラルネットワークの学習 𝑓(𝑥) = 𝑥 + 1. 初期値を決める → 適当に，-5としよう 2. 勾配を求める → 𝑓′(𝑥) = 2𝑥より，f & −5 = −10 3. 勾配に合わせて値を更新する → 勾配が負なので，正の⽅向に動かせばよさそう（⼩さくなりそう） 41

43.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春勾配法値の更新を式で定義する 𝑥 ≔ 𝑥 − 𝜂 f3 x 𝜂は学習率といい，更新する度合いを調整するもの．基本0~1． 42

44.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春勾配法勾配降下法でNNを学習させる際は，パラメータの勾配を求める．この勾配は損失をパラメータ(𝑤)で微分したもので，これに基づいてパラメータを更新する．入力 ! w!! " w!! " w!" ! w!" ! w!# " w"! ! w"! " w"" ! w"" ! w"# 出力損失正解 " w#! " w#" 43

45.

2023/3/15 DDoS2023春 3. ニューラルネットワークの学習確率的勾配降下法勾配降下法にランダムな要素を持たせ，局所的最適解にハマる可能性を減らした⼿法．SGD (Stochastic Gradient Descent) とも．局所的最適解最適解っぽいが実はそうでない場所．極⼩値．真の最適解は⼤域的最適解とよぶ．局所的最適解大域的最適解 44

46.

2023/3/15 DDoS2023春 3. ニューラルネットワークの学習確率的勾配降下法 NNでは以下を繰り返すことでランダム性を取り⼊れる． 1. ⼊⼒と正解の組をランダムにいくつか選ぶ 2. 選んだデータでの勾配を求める 3. 求めた勾配でパラメータを更新する試⾏ごとに関数が変わるイメージ 45

47.

2023/3/15 DDoS2023春 3. ニューラルネットワークの学習誤差逆伝播法 NNのパラメータの勾配を求める⼿法さっきの例では𝑓 𝑥 = 𝑥 "という簡単な関数を使ったが，NNはもうちょい複雑な形をしているので，ちょっと⼯夫が必要層や活性化関数はモデルによって異なるので，𝑓 & 𝑥 = 2𝑥の様に導関数を⼀つ定めることができないのだ 46

48.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春誤差逆伝播法ここで考えるのが，合成関数の微分例として以下の関数を微分してみよう 𝑓 𝑥 = 𝑥+1 + これは普通に展開しても解けるけど，合成関数の微分を使っても解ける 47

49.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春誤差逆伝播法関数の関数を微分する時は，⼀つ⼀つの関数の微分を掛け合わせればいい g 𝑥 =𝑥+1 𝑓 𝑥 =𝑔 𝑥 45 4. 45 4. 45 46 = 46 4. とすると 𝑓 𝑥 = 𝑥+1 + " となり = 2𝑔 𝑥 ⋅ 𝑔3 𝑥 = 2 𝑥 + 1 ⋅ 1 = 2(𝑥 + 1) となる 48

50.

2023/3/15 DDoS2023春 3. ニューラルネットワークの学習誤差逆伝播法これをNNで考えたのが誤差逆伝播法損失を出す時に通った層や活性化関数を微分してそれらを掛け合わせればいいよねという話 49

51.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春誤差逆伝播法例を⾒てみよう出⼒層のある⼀つの重みに着⽬し，勾配を求めてみる ! w!! " w!! " w!" ! w!" ! w!# " w"! ! w"! " w"" ! w"" ! w"# 出力損失正解 " w#! " w#" 50

52.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春誤差逆伝播法この重みから損失を算出するまでの流れをグラフで⾒てみるこの様に演算の流れをグラフで記述したものを計算グラフと呼ぶ全結合層着目した重み 𝑤 × 𝑢 + 𝑦 損失関数 𝑡 正解 𝑥 𝑏 損失前の層の出力バイアス 𝐸 51

53.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春誤差逆伝播法すると，求めたい勾配が以下の様に表せる !" !# !$ !% !# 全結合層着目した重み 𝑤 = !" !$ !% × 𝑢 + 𝑦 損失関数 𝑡 正解 𝑥 𝑏 損失前の層の出力バイアス 𝐸 52

54.

2023/3/15 3. ニューラルネットワークの学習 DDoS2023春誤差逆伝播法この様に微分を逆⽅向に伝えることを逆伝播と呼ぶ 𝜕𝑦 𝜕𝑢 𝜕𝑢 𝜕𝑤 𝑤 𝑥 × 𝑢 𝑏 𝜕𝐸 𝜕𝑦 + 𝑦 損失関数 𝑡 𝐸 53

55.

2023/3/15 DDoS2023春 4. ニューラルネットワークの実装 54

56.

2023/3/15 DDoS2023春 4. ニューラルネットワークの実装ノートブック参照 https://github.com/misya11p/deep-learning/blob/main/neural_network.ipynb 55