第４回 NIPS+読み会・関西発表資料山本

>100 Views

November 09, 17

#ドメイン適応 #転移学習 #時系列データ #深層学習 #VRADA

スライド概要

Variational Recurrent Adversarial Deep Domain Adaptation

Yahoo!デベロッパーネットワーク

@ydnjp

スライド一覧

2023年10月からSpeaker Deckに移行しました。最新情報はこちらをご覧ください。 https://speakerdeck.com/lycorptech_jp

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで

Yahoo!デベロッパーネットワーク 195.1K

ゼロから始める転移学習

Yahoo!デベロッパーネットワーク 92.5K

ヤフーにおける WebAuthn と Passkey の UX の紹介と考察 #idcon #fidcon

idcon fidcon

Yahoo!デベロッパーネットワーク 83.1K

OpenID Connectとネイティブアプリを取り巻く仕様と動向 Yahoo! JAPANの取り組み #openid #openid_tokyo

openid openid_tokyo

Yahoo!デベロッパーネットワーク 65.6K

運用業務とスクラムは本当に組み合わせにくいのか︖運用業務が大半を占めるプロダクト開発での試行錯誤

devsumi

Yahoo!デベロッパーネットワーク 43.7K

ヤフーのオンプレ機械学習基盤AIPFについて #ml_kubernetes

ml_kubernetes

Yahoo!デベロッパーネットワーク 33.8K

各ページのテキスト

Variational Recurrent Adversarial Deep Domain Adaptation 2017-06-29 NIPS+読み会・関西第4回 Yasuo YAMAMOTO 1

自己紹介山本康生 (Yasuo Yamamoto) 所属：データ＆サイエンスサイエンス本部＠大阪オフィス担当：広告サイエンス経歴： • Yahoo! JAPAN 在籍 • これまで京阪奈地区で研究開発(NICT, ATRなど） • KaggleTop10%入賞とか Airbnb(143rd/1462)、HomeDept(85th/2125) 2

本論文について Variational Recurrent Adversarial Deep Domain Adaptation Sanjay Purushotham*,Wilka Carvalho*, Tanachat Nilanon, Yan Liu ＠南カリフォルニア大学 ICML 2017 accepted paper 3

本テーマの課題教師ありデータが不足している • 現状、教師ありデータが溜まった特定の分野でしか精度の高いモデルが構築できない 4

転移学習のモチベーションじゃあモデルを転移しよう “転移学習しよう” 5

転移学習の問題設定 Source Domain 6 Target Domain 𝑌𝑠 𝑌𝑇 𝑋𝑠 𝑋𝑇 1.データが異なる場合 𝑋𝑠 ≠ 𝑋𝑡 2.データの分布が異なる 𝑃(𝑋𝑠 ) ≠ 𝑃(𝑋𝑡 ) 3.ラベルが異なる 𝑌𝑠 ≠ 𝑌𝑡 4.ラベルの分布が異なる 𝑃(𝑌𝑠 ) ≠ 𝑃(𝑌𝑡 )

本研究が扱う転移学習の課題 Source Domain Target Domain 𝑌𝑠 𝑋𝑠 𝑋𝑇 ドメイン転移 Domain Adaptation 7 1.データが異なる場合 𝑋𝑠 ≠ 𝑋𝑡 2.データの分布が異なる 𝑃(𝑋𝑠 ) ≠ 𝑃(𝑋𝑡 ) 3.ラベルが異なる e.g.) ドメインが異なる例 𝑌𝑠 ≠ 𝑌𝑡 年齢別の薬品の効果予測 4.ラベルの分布が異なる地域別のレコメンデーション 𝑃(𝑌𝑠 ) ≠ 𝑃(𝑌𝑡 )

転移学習の取組み Reducing the domain discrepancy between the source and target domains(Ben-David et al. (2007)) ドメイン不一致度を低減する手法 Instance re-weighting (Jiang & Zhai (2007)) 学習に優良なインスタンスの重み付けを行う Subspace alignment (Fernando et al. (2013)) ドメイン間の部分空間のマッピング関数を学習する手法 Deep learning (Tzeng et al. (2015); Ganin & Lempitsky (2014)) Deep Featureなど深層学習から得られる特徴量の転移 Deep Transfer Learning with Joint Adaptation Networks ;(Mingsheng Long, Jianmin Wang, Michael I. Jordan(2016)) 特徴量とラベルの結合分布をヒルベルト空間にマッピングする手法 8

転移学習の取組み Reducing the domain discrepancy between the source and target domains(Ben-David et al. (2007)) ドメイン不一致度を低減する手法 Instance re-weighting (Jiang & Zhai (2007)) 学習に優良なインスタンスの重み付けを行う Subspace alignment (Fernando et al. (2013)) ドメイン間の部分空間のマッピング関数を学習する手法時系列データなどには最適でない Deep learning (Tzeng et al. (2015); Ganin & Lempitsky (2014)) Deep Featureなど深層学習から得られる特徴量の転移 Deep Transfer Learning with Joint Adaptation Networks ;(Mingsheng Long, Jianmin Wang, Michael I. Jordan(2016)) 特徴量とラベルの結合分布をヒルベルト空間にマッピングする手法 9

10.

本研究のシナリオ時系列隠れ変数の依存性を考慮する教師なしドメイン適応を実現する実際の医療データを使って実験する 10

11.

本研究の提案 Variational Recurrent Neural Network Domain Adversarial Neural Networks VRNN DANN (Chung et al. (2016)) (Ganin et al. (2016)) Variational Recurrent Adversarial Deep Domain Adaptation VRADA 11

12.

先行研究の特徴 Variational Recurrent Neural Network Domain Adversarial Neural Networks VRNN DANN (Chung et al. (2016)) (Ganin et al. (2016)) 隠れ変数をドメインラベルで Adversarial Trainingするタイムステップが異なる時系列データの隠れ変数モデリングに強い Variational Recurrent Adversarial Deep Domain Adaptation VRADA 12

13.

VRADA グラフィカル・モデル : VRNN - Variational Recurrent Neural Network : DANN - Domain Adversarial Neural Networks 13

14.

VRADA グラフィカル・モデルの処理 : inference process : generation process : recurrent process : classification 𝑧: latent variable ℎ: hidden state 𝑥: data 𝐺𝑦: DNN for a label 𝐺𝑔: DNN for a domain 14

15.

VRNNの目的関数 Encoder: Prior: DNN DNN Decoder: DNN 15

16.

VRNNの目的関数 KL-Divergence 推論モデル： 𝑖 𝑖 𝑞𝜃𝑒 𝑧𝑡𝑖 𝑥≤𝑡 , 𝑧<𝑡 過去のモデル: 𝑖 𝑖 𝑝 𝑧𝑡𝑖 𝑥<𝑡 , 𝑧<𝑡 生成モデル: 𝑖 𝑖 𝑝𝜃𝑔 𝑥𝑡𝑖 𝑧≤𝑡 , 𝑥<𝑡 16

17.

DANN分類正則化項の追加分類正則化項分類正則化項： DNN DNN 17 正解レベルドメインラベル

18.

VRADAの目的関数 RNN項ラベル分類項ドメイン分類項 𝑁: 全サンプル数 𝑇: 対象時間 𝑛: ソースドメイン・サンプル数 𝑛′: ターゲットドメイン・サンプル数 18

19.

最適化とパラメータ更新 Generator, Encoder, クラス分類のパラメータを求めるドメイン分類のパラメータを求める SGDで更新 𝜂: 学習率 19

20.

実験データ MIMIC-III • 匿名化された成人38,645人と新生児7,875人の入院記録58,000件以上 https://physionet.org/physiobank/database/mimic3cdb/ 20

https://physionet.org/physiobank/database/mimic3cdb/

21.

実験データ:MIMIC-III AHRF(急性低酸素呼吸不全)データセット患者分類ドメイン説明サンプル数成人グループ2 20〜45歳 508 グループ3 46〜65歳 1,888 グループ4 66〜85歳 2,394 グループ5 85歳以上 437 グループ1 0〜１９歳 398 子供 ICD9 データセット変数説明 𝑋 患者の体液（インスリンなど）臨床検査結果（pH値、血小板数など）処方イベント（アスピリン、塩化カリウムの詳報など） 𝑦 21 ICD9診断コード

22.

問題設定死亡率予測 ICD9診断コード予測ドメイン適応タスク 22

23.

死亡率予測の結果提案手法は死亡率推定で良い結果 Domain Adaptationなし 23 Domain Adaptationあり

24.

ICD9診断コード予測提案手法はICD9診断コード予測でもで良い結果 24

25.

ドメイン適応3-4,2-5：ニューロン発火状態提案手法はSource-Target間でニューロンの励起が似ている 25

26.

ドメイン適応3-4,2-5：ドメイン適応・時間推移提案手法はニューロンの時系列遷移を鮮明に表現している 26

27.

t-SNEプロジェクション提案手法はTargetとSourceが分離されることなく表現できている 27