【生成Deap Learning 第2版】10.1~10.3

>100 Views

June 12, 25

スライド概要

profile-image

AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください!

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

2025年度前期輪読会 生成Deep Learning #8 (6/12) 10章 高度なGAN 京都大学理学部数理科学系 千葉 一世 0

2.

アジェンダ ◼ ProGAN ◼ StyleGAN 1

3.

ProGAN ProGAN(PGGAN) : 低解像度から徐々に解像度を上げていく学習手法によって、 学習速度と安定性を高めたモデル 学習の初期段階でいきなり解像度の高い画像を上手く生成するのは難しい 解像度の低い生成しやすい物から初めて、学習の過程で解像度を上げていこう 2

4.

ProGAN • Progressive Growing 学習中にどのようにモデルを変更するのか? 解像度の「移行フェーズ」と「安定フェーズ」 • 移行フェーズ いきなり未学習の高解像度の層を追加してしまうと学習が上手くいかない 学習済みの低解像度な出力を残差接続で残しつつ、その割合を徐々に減らして慣らしていく • 安定フェーズ 低解像度の割合が0になったら、高解像度の層のみを学習させていく。 3

5.

ProGAN Progressive学習 4

6.

ProGAN • ミニバッチ標準偏差 識別器内で、ミニバッチ内のピクセル全体の特徴量の標準偏差を新しい特徴量として追加する 本物の教師データは画像に多様性があるので、偽物のデータが同じような画像ばかり 生成する様になると、簡単に区別できるようになってしまう。 生成器が多様な画像を生成する方向に学習が進む 5

7.

ProGAN • 等化学習率 重みの初期値は通常「Heの初期値」などの標準偏差を入力の数に依存して決める AdamやRMSPropなどのoptimizerと組み合わせると、各層でのパラメータの更新量が 入力の数に依存する形となり、層毎に学習率が異なる状態になっているとみなせる。 初期化は標準正規分布で行い、動的に重みを正規化して、各層で同じ学習率となる、 6

8.

ProGAN • ピクセル正規化 ピクセル毎に特徴量が単位ベクトルになるように正規化を行う ProGANではバッチ正規化の代わりにピクセル正規化を用いる 7

9.

ProGAN 学習結果 8

10.

アジェンダ ◼ ProGAN ◼ StyleGAN 9

11.

StyleGAN StyleGAN : 画像の低レベル~高レベルまでのスタイル・属性を潜在空間内で 上手く分離させ、制御することが出来るモデル StyleGANはProGANをもとに構成される ProGANからの変更点 • 潜在ベクトルを非線型変換により、 新たな潜在空間へ写す • 生成器の初期値は定数 • 生成時の各解像度で変換した潜在ベクトルと ノイズを付与する • スタイルミキシング 10

12.

StyleGAN • 写像ネットワーク(Mapping NetWork) ただ正規分布に従うだけの潜在ベクトルを、非線型変換によってスタイルの情報を持つ 新たな潜在空間へと写し、スタイルを制御しやすくする。 11

13.

StyleGAN • 合成ネットワーク(Synthesis network) ProGANの段階的に解像度を上げていく生成器 固定された初期値から生成され、各解像度の段階で、適応型インスタンス正規化による スタイル情報の注入と、ノイズの付与が行われる。 スタイル情報・ノイズを各段階で注入していくことで十分なランダム性が得られ、 初期値は定数にできる。さらに、注入する情報のみがランダム性を持ち制御しやすくなる。 スタイル・ノイズを解像度ごとに入れることにより、低解像度では大域的な・ 高解像度では局所的な情報を指定することが出来る。 適応型インスタンス正規化 インスタンス正規化によって各チャンネルで正規化する際に、平均と分散を スタイル情報を線形変換して得られる値になるように正規化する。 これによって、各解像度段階でスタイル情報を取り入れる。 12

14.

StyleGAN 適応型インスタンス正規化 合成ネットワークの各解像度のブロック インスタンス正規化と合わせて使用 13

15.

StyleGAN • Style Mixing 潜在ベクトルを一つではなく二つ使用し、各層でランダムにどちらかの潜在ベクトルからの スタイル情報を使用する。 これにより、各層に異なるスタイルが入り隣接したスタイル潜在ベクトルの独立性につながる。 14

16.

StyleGAN 途中の解像度から異なる潜在ベクトルを使用した時の画像の変化 低解像度の段階からBのスタイルを入れると 顔の形・表情・構図など大きな部分が Bの画像による 高解像度の段階でBのスタイルを入れると 画像は大きくは変わらず、肌・髪色など 細部のみがBに近づく 低 各解像度の段階で潜在ベクトルがきちんと 中 画像のスタイルを指定できている 高 15

17.

ProGAN実装コード https://colab.research.google.com/github/kerasteam/kerasio/blob/master/examples/generative/ipynb/stylegan.ipynb# scrollTo=xH8czS5LR01R 16