【ゼロから作るDeep Learning④】7.3~7.5

>100 Views

December 11, 25

スライド概要

profile-image

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください!

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

2025年後期輪読会#8(2025/12/11) ゼロから作るディープラーニング 7.3~7.5 京都大学大学院 理学研究科 M2 佐藤海里 0

2.

アジェンダ ◼ 7.3 ニューラルネットワーク ◼ 7.4 Q学習とニューラルネットワーク ◼ 7.5 まとめ 1

3.

7.3 非線形な関数を近似する(前期の復習) ・データセット 𝑠𝑖𝑛 2𝜋𝑥𝑖 + noise(𝑖),i ∈ 1,2, … 𝑛 を2層のNNを用いて曲線近似する. ・線形回帰問題でないため,入力データに対して線形変換のみを行うだけではNG. ReluやSigmoidなどの活性化関数を用いる. 2

4.

7.3 dezero(フレームワーク)の機能について ・レイヤクラス…パラメータの管理や初期値の設定を行う. ・モデルクラスをレイヤを使って定義する.(NNモデルを実装) ・オプティマイザクラス…パラメータの更新(最適化)手法を定義. 3

5.

7.4 Q学習をdezeroで実装 (Grid Worldを解く) ・以下の流れで実装する. ステップ 内容 1 状態を one-hot ベクトル化 2 2 層 NN(QNet)を定義 3 ε-greedy で行動を選択 4 Q 学習の更新式で NN のパラメータを更新 5 1000 エピソード学習し、損失を記録 6 学習後の Q 値をグリッドに可視化 ・損失関数としては,targetとQ(s,a)の2乗誤差を用いる. 4