【ゼロから作るDeap Learning】3.1~3.4

445 Views

May 12, 25

#ニューラルネットワーク #活性化関数 #パーセプトロン #多次元配列 #機械学習

スライド概要

京都大学人工知能研究会KaiRA

@kyoto-kaira

スライド一覧

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください！

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【論文読み会】GraphCast: Learning skillful medium-range global weather forecasting

京都大学人工知能研究会KaiRA 30.1K

【論文読み会】NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

京都大学人工知能研究会KaiRA 22.9K

【IT Text 自然言語処理の基礎】第7章：事前学習済みモデルと転移学習

京都大学人工知能研究会KaiRA 21.3K

【物体検出】ResNet・EfficientNet (v2)

京都大学人工知能研究会KaiRA 18.5K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.3節まで）

京都大学人工知能研究会KaiRA 13.1K

【Pythonで学ぶ音声認識】第5章：GMM-HMMによる音声認識（5.5節）

京都大学人工知能研究会KaiRA 12.1K

各ページのテキスト

2025年度前期輪読会 #3 (2025/5/12) 第3章ニューラルネットワーク(~3.4節まで) 京都大学文学部倫理学研究室 B3 竹田章汰 0

アジェンダ ◼ パーセプトロンからニューラルネットワークへ ◼ 活性化関数 ◼ 多次元配列の計算 ◼ 3層ニューラルネットワークの実装 ◼ 出力層の設計 ◼ 手書き数字認識 1

パーセプトロンからニューラルネットワークへニューラルネットワークの基本形を図示し、パーセプトロンとの共通点・相違点を掴むニューラルネットワークの例中間層入力層出力層パーセプトロンとの共通点相違点 ⚫ ニューロンのつなが ⚫ 適切な重みパラメーり方タをデータから自動で学習できる ⚫ 複雑な関数・処理も、 (理論上)表現できる ↑機械学習のキモ！ 2

パーセプトロンからニューラルネットワークへパーセプトロンの信号伝達方法を振り返り、ニューラルネットワークへの導入をするパーセプトロンの復習 1 𝑥1 𝑏 𝑤1 𝑦 𝑥2 𝑥1 𝑦 𝑤2 𝑥2 3.1 𝑤1 0 𝑏 + 𝑤1 𝑥1 + 𝑤2 𝑥2 ≤ 0 𝑦=ቊ 1 𝑏 + 𝑤1 𝑥1 + 𝑤2 𝑥2 > 0 𝑤2 3.2 𝑦 = ℎ 𝑏 + 𝑤1 𝑥1 + 𝑤2 𝑥2 3.3 0 (𝑥 ≤ 0) ℎ 𝑥 =ቊ 1 (𝑥 > 0) 3

パーセプトロンからニューラルネットワークへ活性化関数を導入する活性化関数入力信号の総和を出力信号に変換する関数 →前項のℎ 𝑥 3.3 0 (𝑥 ≤ 0) ℎ 𝑥 =ቊ 1 (𝑥 > 0) →右の図のように活性化関数によるプロセスは明示化できる 1 𝑏 𝑥1 𝑥2 𝑤1 𝑎 ℎ( ) y 𝑤2 →式(3.3)で表される活性化関数は「ステップ関数」 →パーセプトロンでは、活性化関数にステップ関数を使用している！！ 3.4 𝑎 = 𝑏 + 𝑤1 𝑥1 + 𝑤2 𝑥2 3.5 𝑦=ℎ 𝑎 4

活性化関数ニューラルネットワークで使用される活性化関数「シグモイド関数」を導入するシグモイド関数シグモイド関数(sigmoid function) 3.6 1 ℎ 𝑥 = 1 + exp(−𝑥) →ニューラルネットワークとパーセプトロンの主な違いは、この活性化関数のみ →ニューロンが多層につながる構造や、信号の伝達方法は基本的に同じシグモイド関数(sigmoid function)のグラフ 5

活性化関数ステップ関数とシグモイド関数を比較するステップ関数とシグモイド関数の比較ステップ関数との共通点 ⚫ 入力が小さいときには0に近く、入力が大きいときには1に近い(0と1の間の値しかとらない) 相違点 ⚫ 「滑らかさ」 ⚫ 連続な実数値をとる ⚫ 非線形関数 →ニューラルネットワークには必ず、非線形関数を活性化関数に用いる必要があるステップ関数とシグモイド関数を重ねて描画 (破線はステップ関数) →線形関数を用いると、どれだけ層を深くしても、「隠れ層のないネットワーク」と同じ働きしかできない 6

活性化関数 ReLU関数を紹介する ReLu関数 ReLu関数(ReLU function) →最近のニューラルネットワークで主に用いられている活性化関数 𝑥 (𝑥 > 0) ℎ 𝑥 =ቊ 0 (𝑥 ≤ 0) →入力が0を超えていれば、その入力をそのまま出力し、0以下ならば0を出力する関数 7

多次元配列の計算 NumPyによる多次元配列の計算を学び、ニューラルネットワークの実装に備える多次元配列と行列の積行列の積の直観的な計算方法 →行列とは2次元配列のこと 8

10.

3層ニューラルネットワークの実装ニューラルネットワークの処理の説明のため、新たに記号を導入する記号の定義 (1) 𝑎1 𝑥1 左図は入力層𝑥2 のニューロンから、次層の (1) ニューロン𝑎1 への重みだけを取り上げたもの重みや隠れ層のニューロンの右上にある(1)は第一層であることを示している (1) 𝑤12 (1) 𝑎2 𝑥2 (1) 𝑤12 ←第一層の重み ← 「1」は次層の1番目のニューロン「2」は前層の2番目のニューロン (1) 𝑎3 9

11.

3層ニューラルネットワークの実装 3層ニューラルネットワークの実装を、段階を追って行う 3層ニューラルネットワーク左図のような3層ニューラルネットワークを実装していく 𝑥1 𝑦1 𝑥2 𝑦2 → 各層における信号伝達を、順に実装する 10

12.

3層ニューラルネットワークの実装入力層から第一層目への信号伝達を行列の積で表す入力層から第一層目左図より (1) 1 (1) 𝑏1 (1) 𝑎1 (1) 𝑤11 𝑥1 (1) 𝑎2 𝑥2 (1) (1) (1) 𝑎1 = 𝑤11 𝑥1 + 𝑤12 𝑥2 + 𝑏1 また、行列の積を用いて第1層目の重み付き和を 𝐀(1) = 𝐗𝐖 (1) + 𝐁 (1) と表せる但し、 (1) (1) (1) (1) (1) (1) 𝐗 = 𝑥1 𝑥2 𝐁 (1) = 𝑏1 𝑏2 𝑏3 𝐀(1) = 𝑎1 𝑎2 ここに数式を入力します。 𝑎3 (1) 𝑤12 (1) 𝑎3 𝐖 (1) = (1) (1) (1) (1) (1) (1) 𝑤11 𝑤21 𝑤31 𝑤12 𝑤22 𝑤32 11

13.

3層ニューラルネットワークの実装活性化関数によるプロセスを図示する第一層目の活性化関数左図に示す通り、隠れ層での重み付き和を𝑎 で表し、活性化関数で変換された信号をzで表す (1) 𝑏1 1 (1) 𝑎1 ℎ( ) (1) 𝑧1 (1) 図中のh()は活性化関数であり、ここではシグモイド関数を用いる 𝑤11 𝑥1 (1) 𝑎2 ℎ( ) (1) 𝑤12 𝑥2 (1) 𝑎3 ℎ( ) (1) 𝑧2 (1) 𝑧3 →前項と本項のプロセスと全く同じように、第一層目から第二層目、第二層目から出力層への信号伝達も表せる →ただし、出力層の活性化関数だけ、シグモイド関数ではなく恒等関数σ()を用いる 12

14.

3層ニューラルネットワークの実装実装のまとめ実装の概略図 1 1 ℎ( ) ℎ( ) σ( ) 𝑦1 𝑥1 左図の出力層にあるσ()が前項で述べた恒等関数 → 入力をそのまま出力する関数 ℎ( ) ℎ( ) σ( ) 𝑦2 𝑥2 →実際にコードを書いて実装してみよう ℎ( ) 13

https://colab.research.google.com/drive/11FRE9Jrzn3umI6XlvZAxjywfzpAc5NYi?usp=sharing