[DL輪読会]Learning by Association - A versatile semi-supervised training method for neural networks[CVPR2017]

>100 Views

June 13, 17

#deep learning #Semi-Supervised Learning #Neural Networks #Machine Learning #Data Association #Domain Adaptation

スライド概要

2017/6/13
Deep Learning JP:
http://deeplearning.jp/seminar-2/

Deep Learning JP

@DeepLearning2023

スライド一覧

DL輪読会資料

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

【DL輪読会】KAN: Kolmogorov–Arnold Networks

Deep Learning JP 89.8K

【拡散モデル勉強会】拡散モデルの数理

Deep Learning JP 65.2K

【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

Deep Learning JP 60.7K

【DL輪読会】Conditional Flow Matching

Deep Learning JP 46K

【拡散モデル勉強会】Introduction to Diffusion Models

Deep Learning JP 45.9K

【DL輪読会】Cosmos World Foundation Model Platform for Physical AI

Deep Learning JP 43.9K

各ページのテキスト

Learning by Association A versatile semi-supervised training method for neural networks 東京大学大学院中山研究室横田匡史

Semi-Supervised Learning ‣ グラフベースデータの類似グラフを作りラベルを伝搬 ‣ 決定境界をデータから遠ざける(擬似データetc) １．学習したモデルを用いてラベルなしデータをラベル付け(pseudo-label etc.) ２．または、ラベル付きデータにノイズを入れる(VAT) ‣ 多様体学習多様体の推定にラベル無しデータ用いる(Tanget Manifold Classifier) ‣ 生成モデルラベルなしデータを特徴量学習に用いるか不完全データとして学習に用いる(VAE etc.) (参考: https://www.slideshare.net/beam2d/semisupervised-learning-with-deep-generative-models) →今回のテーマは、”グラフベース”と”決定境界をデータから遠ざける”の中間

Idea 記憶イヌ！人間は、学習サンプルに関連付けて考えることができるので少数サンプルでも正確に回答できる。 →学習サンプルとラベルなしデータを紐付けながら学習する事で同じことができないか？

Idea Labeled Unlabeled Labeled 同じクラスの２つのラベル付きデータの間に適切なラベルなしデータを紐付けられるように学習する。

Overview Unlabeled Label X Label Y walkerが「ラベル付き→ラベルなし→ラベル付き」と遷移させた時にスタートとゴールのクラスが同じになるように学習させる。この時のwalkerは類似度から算出される遷移確率に従い行動する。

Method

Method • A: ラベル付きデータ • B: ラベルなしデータ • AiのデータとBjのデータの類似度Mij: 内積 • この類似度Mを元にwalkerの遷移確率を求める

Method • Transaction Probability • Round Trip Probability

Walker Loss (※H: cross entropy) 同じクラス間のPathの確率は一様分布に、異なるクラス間のPathの遷移確率が0にさせる。しかし、これだけだと難しいラベルなしデータ (Ex. MNISTの1に似た7のラベルなし画像)の遷移確率も0に近づいてしまい、簡単なデータだけが残ってしまう。

10.

Visit Loss Unlabeled Label X Label Y ここの微妙なポイントも有効に活用したい。

11.

Visit Loss (※H: cross entropy) Aiから全てのBに対する遷移確率が一様分布にさせる →明らかなデータだけでなく難しいデータも遷移確率が上がるようにする。

12.

Loss Function Total Loss Function • • は、通常の教師ありで用いる softmax cross entropy。実際にはVisit Lossには正則化の力が大きいので重みをかけた方が良い結果が得られている(後述)。

13.

Experiment

14.

Experiment - - 検証項目 ‣ 提案手法を用いて性能が上がるかどうか ‣ 上手くラベルなしデータを関連付けできているか ‣ Domain Adaptation(SVHN→MNIST)への応用 Dataset ‣ MNIST: (labeled: 100 or 1000 or All, unlabeled: labeledで使ってないデータ) ‣ STL-10: (labeled: 5k, unlabeled: 100k) ‣ SVHN: (labeled: 0 or 1000 or 2000 or All, unlabeled: labeledで使ってないデータ) ✓ 訓練用データの中のラベル付きデータを一部だけ使い、残りはラベル無しとして学習を行う。

15.

Setting • Batch Size: 100 • Optimizer: Adam • 出力層以外の活性化関数: elu • 正則化項: L2 norm (重み:10-4)

16.

MNIST Result

17.

遷移確率の変化(MNIST) 学習前学習後

18.

MNIST エラー分析全ラベルデータテストデータの Confusion Matrix テストデータの間違えた部分筆者らの主張では、ラベル付きデータにない特徴がテストに存在したため(Ex. 4の上が閉じていて9に似ている)間違えてしまっている。

19.

SLT-10 学習データにないクラスのデータを入力しても、比較的近いラベルなしデータの関連付けができている。

20.

SVHN Result 少ないサンプルにおいては、先行研究よりかは精度良い。

21.

SVHN ラベルなしデータの効果検証ラベルなしデータが多くなるにつれて、精度は良くなっている。

22.

Visit Lossの効果検証 Labeled Data Size: 1000 Visit Lossが大きすぎるとモデルへの正則化が強すぎて、上手く学習できない。データのバリアンスに応じて重みを調整すべき。(Ex. labeledとunlabeledが似ていない場合、Visit Lossは小さくする。)

23.

Domain Adaptation 教師あり学習 Domain Adaptation 教師あり学習 DA: Domain-Adversarial Training of Neural Network[2016 Ganin et. al.] DS: Domain separation networks [2016 Bousmalis et. al.]

24.

まとめ • ラベルなしデータとラベルありデータに関連付けるように学習する。 • ラベル付きデータが少なくても、比較的上手く学習ができる。 • Visit Lossは、データのバリアンスを見て設定する。 • Domain Adaptationに応用しても上手くいった