【ゼロから作るDeap Learning】3.4~3.7

314 Views

May 14, 26

#ニューラルネットワーク #ディープラーニング #フォワード計算 #ソフトマックス関数 #手書き数字認識

スライド概要

京都大学人工知能研究会KaiRA

@kyoto-kaira

スライド一覧

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください！

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

【論文読み会】GraphCast: Learning skillful medium-range global weather forecasting

京都大学人工知能研究会KaiRA 31.4K

【IT Text 自然言語処理の基礎】第7章：事前学習済みモデルと転移学習

京都大学人工知能研究会KaiRA 24.4K

【論文読み会】NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

京都大学人工知能研究会KaiRA 23.9K

【物体検出】ResNet・EfficientNet (v2)

京都大学人工知能研究会KaiRA 20.5K

【物体検出】MaskFormer

京都大学人工知能研究会KaiRA 15.8K

【物体検出】DINO

京都大学人工知能研究会KaiRA 14.6K

各ページのテキスト

2026年度前期輪読会 #4 (2026/05/14) ゼロから作るDeep Learning 第3章ニューラルネットワーク (3.4~3.7) 京都大学工学部情報学科 B1 柴田倫宏 0

自己紹介 • 所属: 京都大学工学部情報学科一回生 • 興味分野: エネルギー効率の高いAI (Green AI) 生物学的に妥当なニューラルネットワーク (Biologically Plausible Neural Networks) しばたみちひろ柴田倫宏 • 個人的な趣味: 数理を可視化して楽しむこと 1

アジェンダ ◼ 3層NNの実装(フォワード) ◼ 出力層の設計 ◼ 手書き数字認識 ◼ まとめ 2

3層NNの実装(フォワード) 3層NNの構成 3層NNのニューロンは、 • 入力層(第0層): 2つ • 1つ目の隠れ層(第1層): 3つ • 2つ目の隠れ層(第2層): 2つ • 出力層(第3層): 2つのように配置されている場合を考える。入力層隠れ層出力層 (第0層) (第1,2層) (第3層) 3

3層NNの実装(フォワード) 記号の説明下付き添え字の順番に注意 4

3層NNの実装(フォワード) 第一層への入力インデックスに注意 5

3層NNの実装(フォワード) 第一層からの出力 6

3層NNの実装(フォワード) 第2層/出力層の計算 7

アジェンダ ◼ 3層NNの実装(フォワード) ◼ 出力層の設計 ◼ 手書き数字認識 ◼ まとめ 8

10.

出力層の設計恒等関数とソフトマックス関数ソフトマックス関数恒等関数 … … 9

11.

出力層の設計オーバーフロー対策指数関数の値は大きくなりやすいので、オーバーフローに対策する必要がある。下の式変形を利用する。 10

12.

出力層の設計ソフトマックス関数の性質出力の総和が1 大小関係の保存これら3つの大小関係はすべて一致する出力を確率として扱える 11

13.

出力層の設計多クラス分類問題 Nクラスに分類する問題では出力層のニューロン数をNとする出力層の活性化関数としてソフトマックス関数を適用する (書籍の3.5.4から引用) 各ニューロンの出力値は各クラスに分類される確率を表す 12

14.

アジェンダ ◼ 3層NNの実装(フォワード) ◼ 出力層の設計 ◼ 手書き数字認識 ◼ まとめ 13

15.

手書き数字認識 MNISTデータセット MNIST(エムニスト)は、手書き数字の画像セットとして非常に有名なデータセットである。論文の実験用データとしてもよく登場する。 MNISTの画像例(書籍の3.6.1から引用) 書籍では、MNISTデータセットを扱うためにpythonスクリプトのmnist.pyが提供されている。(場所は以下のgithubのurlから、deep-learning-from-scratch/dataset/mnist.py) Github: https://github.com/oreilly-japan/deep-learning-from-scratch 14

https://github.com/oreilly-japan/deep-learning-from-scratch

16.

手書き数字認識推論処理の流れ画像と正解ラベルを読み込む (load_mnist関数) 学習済みの重みとバイアスを読み込む (sample_weight.pkl) 推論処理を行う (仕組みは前のスライドと同じ) Pickleは、プログラム実行中にオブジェクトをファイルとして保存する機能のこと。ファイルをロードすると、実行時のオブジェクトを即座に復元できる。認識精度を求める活性化関数は1, 2層でシグモイド関数、出力層でソフトマックス関数とする。 15

17.

手書き数字認識実装コード(GoogleColab) https://colab.research.google.com/drive/1_9D9p89JGmAQC4wGXGeYc_G22NmQoRdc?usp=sharing 実装コード実装コード https://colab.research.google .com/drive/1_9D9p89JGmA QC4wGXGeYc_G22NmQoR dc?usp=sharing 16

https://colab.research.google.com/drive/1_9D9p89JGmAQC4wGXGeYc_G22NmQoRdc?usp=sharing

18.

手書き数字認識バッチ処理とは画像1枚ごとに行列計算する場合 (書籍の3.6.3から引用) 画像100枚分をまとめて一度に行列計算する場合 (書籍の3.6.3から引用) バッチを用いた推論処理では、一枚ごとに処理する場合と同じ関数(predict)を用いることができ、入力Xを行列としてそのまま渡せばよい。 17

19.

手書き数字認識バッチ処理の利点 • 多くのライブラリが大きな配列を計算するために最適化されているため、大きな行列で一度に計算を行うことで計算時間を短縮できる。 • データを一度にまとめて送ることで、データ転送のボトルネックの影響を低減できる。データをまとめて処理した方が合計の処理時間を短縮できる。 18

20.

アジェンダ ◼ 3層NNの実装(フォワード) ◼ 出力層の設計 ◼ 手書き数字認識 ◼ まとめ 19

21.

まとめ • 活性化関数としてシグモイド関数、ReLU関数のような非線形関数を用いる。 • 多次元配列を利用することでニューラルネットワークを効率的に実装できる。 • 機械学習の問題は回帰問題と分類問題に大別され、それぞれ活性化関数に恒等関数とシグモイド関数を利用する。 • クラス分類問題では、出力層のニューロン数をクラスの数に設定する • データをまとめてバッチ処理することで計算を高速化できる。 20

22.

出典・権利表記参考文献 • 輪読用書籍斎藤康毅, 『ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装』, オライリー・ジャパン, 2016. 21