STL10 CNN コンペ

>100 Views

April 22, 26

#STL10 #CNN #Optuna #データ増強 #Transform v2

スライド概要

こた

@kota

スライド一覧

(。╹╹。)

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

奥深いQRコードの世界

こた 3.6K

PythonでCPUエミュレータを作ってみよう！

こた 3K

Crafting Interpreters

こた 441

奥深いバーコードの世界

こた 270

コンパイラブック

こた 241

CCDイメージセンサの基礎

こた 112

各ページのテキスト

STL10 CNN コンペ accuracy: 0.904625 0.92925

ソースコード github.com/yashikota/stl10-cnn-compe

https://github.com/yashikota/stl10-cnn-compe

ネットワーク正規化活性化畳み込みの順番が精度良い → 後から調べたら WideResNetで実装されてた 😭 活性化はSwish Mishは精度悪なった

ネットワーク

optuna PFNが出しているハイパーパラメータ自動最適化ツール学習率や重み、バッチサイズ、最適化関数などを自動で最適化ランダムサーチやグリッドサーチと違ってベイズ最適化を使ってるため速く高精度ネットワークの層数やチャンネル数も探索できるが、今回は不使用途中からAdamのバッチサイズ128に固定 https://optuna.org

https://optuna.org

データ増強 STL10のTrainは各ジャンル500 → 少ないなので外部のデータセットのデータを注入して増やす - CIFAR10 (train, test): 各 6000 CIFARNET (train, test): 各 20,000 Dogs vs. Cats (train): 犬猫 12,000 Monkey-Species-Collection (train, test): 猿 1400 [自作] ImageNet Monkey (train): 猿 10,400 The Oxford-IIIT Pet Dataset( train, test): 犬猫 5000 Horse2zebra (train, test): 馬 1200 0: airplane, 1: bird, 2: car, 3: cat, 4: deer, 5: dog, 6: horse, 7: monkey, 8: ship, 9: truck

データ拡張 AutoAugment: 回転・反転・色変換などの画像変換の種類とその強度を学習中に自動最適化させるデータ拡張手法今回は AutoAugmentPolicy に CIFAR10で学習した物を使用 v2.AutoAugment(policy=v2.AutoAugmentPolicy.CIFAR10) ただし最適なパラメータを探索するコストが大きい (policy適応したら探索なし？) NVIDIA Tesla P100での結果 → P100はRTX 2080ぐらいの性能改善手法もある (割愛)

データ拡張

transform 去年にtransformのv2が出た処理が早くなって CutMixやMixUpに対応した今後の機能追加はv2だけただし ToTensor は非推奨に