ベイズ統計_07_マルコフ連鎖モンテカルロ法(2)

1.

ベイズ統計 07 マルコフ連鎖モンテカルロ法(2) 分寺杏介神戸大学大学院経営学研究科  [email protected] ※本スライドは，クリエイティブ・コモンズ表示-非営利 4.0 国際ライセンス（CC BY-NC 4.0）に従って利用が可能です。

https://creativecommons.org/licenses/by-nc/4.0/

2.

MCMC ▌stanはMCMC法を行うプログラミング言語です前回は Markov Chain マルコフ連鎖と Monte Carlo 法のお話をしましたモンテカルロ今回はこれらを組み合わせたMCMC法の話です 07 マルコフ連鎖モンテカルロ法(2) 2

3.

前回のおさらい｜モンテカルロ法【メリット】これまでもモンテカルロ法ってましたにわかった事分布からのをって時間さえかければたいていの問題には答えが出せる事パラメータの次元が増えてもなんとかなる事分布の分布からのき分布になっていからのいまったしてみたもにはおをしてれがにをい分布合はを・ッ事【デメリット】事分布からのも乱数作るかンマに乱数のからのンプリングを用いて，から分布からのこと（事にしてもに可能です）（事）（事）はをもとにしていのでになといますをに従う事ンプリングとともなれのでな計算に時間がかかるマルコフ連鎖モンテカルロ法コンピュータに負荷がかかる乱数生成しやすい分布じゃないと使えない 04, 05ではモンテカルロ法にって・を行っていたベイズ統計の場合，共役事前分布がないと厳しい共役事前分布がないときにもモンテカルロ法使えないかなぁこんなのだと乱数も作りづらい 07 マルコフ連鎖モンテカルロ法(2) 3

4.

前回のおさらい｜マルコフ連鎖 ▌1時前の状態のみに依存して率が決ま 0.4 【例】昨日はステーキ食べました。なので今日は 0.2 ヘルシ寄で行こかと思います。 0.3 0.3 0.2 0.1 クで今日の晩ごはを決めます。 0.1 0.5 0 0.2 0.2 0.2 0.3 • 0.3の確率で焼き魚 • 0.1の確率でチャーハン • 0.6の確率でサラダ • 2日連続ステーキにはならない確率0 0.6 0.1 0.3 07 マルコフ連鎖モンテカルロ法(2) 4

5.

前回のおさらい｜マルコフ連鎖のいいとこ ▌どんな初期値から始めても終収束した 1日は, 「前の日」のには常分布に収束す常分布からのランダムンプリングとに基づいて抽選 51日目 [,1] [,2] [,3] [,4] [1,] 0.4 0.3 0.2 0.1 100日目 [,1] [,2] [,3] [,4] [1,] 0.2 0.2 0.3 0.3 気にn日分抽選 > pi_n [,1] [,2] [,3] [,4] [1,] 0.2707483 0.3006803 0.262585 0.1659864 … 50日目 [,1] [,2] [,3] [,4] [1,] 0.2 0.5 0.1 0.2 常分布から … 07 マルコフ連鎖モンテカルロ法(2) 5

6.

前回のおさらい｜ベイズ ▌どな初におけマルコフ連鎖の利用から始めても終には常分布に収束す統計にはこれが事晩ごはの例常分布わからないベイズ率ゃどうすかモデル尤度×事前分布ならわか事後移分布になってほしいわかそのものは，周辺尤＝積があるので無理定常＝事後となるよな移確率はわからない移確率行列使って計算したら定常がでてる事移率をうまいことって，常分布が分布と形になうにす移率をどう設すと常分布が事分布になか 07 マルコフ連鎖モンテカルロ法(2) 6

7.

前回のおさらい｜連続分布での表 ▌連続分布へ拡張す合，和→積分に置き換えだけで良い特 𝑡+1 𝑃 𝜃 離散分布では（常分布）事分布連続分布では 𝑃 𝜃 𝑡+1 = න𝑃 𝜃 𝑡 𝜃𝑡 合 ෍ 𝑃 𝜃 𝑡 = 𝑖 𝑃 𝜃 𝑡+1 = 𝑗 𝜃 𝑡 = 𝑖 移率）移核 𝑃 𝜃 𝑡+1 した 𝑃 𝜃 𝑡+1 = 𝑗 = = 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 （の事象に限 𝑖 𝑑𝜃 𝑡 𝑃 𝜃 𝑡+1 = 𝑗 = න 𝑃 𝜃 𝑡 = 𝑖 𝑃 𝜃 𝑡+1 = 𝑗 𝜃 𝑡 = 𝑖 𝑑𝑖 ここがどのうな設でれ 𝑃 𝜃 𝑡 = 𝑃 𝜃 𝑡+1 となのか？ 06 マルコフ連鎖モンテカルロ法(1) 7

8.

前回のおさらい｜マルコフ連鎖に基づ（常分布）事分布連続分布では 𝑃 𝜃 𝑡+1 局っていことは 𝜃𝑡 の分布から適当な 𝜃𝑡 をす移率）移核【ポント】確率事後全体の形はからなても事後における特定の点の確率密は計算可能 = න 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 𝑑𝜃 𝑡 =𝑃 𝜃𝑌 ∝𝐿 𝑌𝜃 𝑃 𝜃 ▌ （ = 𝑃 𝜃 𝑡+1 (に比例す )のは可能なので，上の式を 𝑃 𝜃 𝑡+1 𝜃 𝑡 = 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 の 𝑃 𝜃𝑡 の形に整理できれ良さそう 𝜃 𝑡 所与のもとで，次の 𝜃 𝑡+1 の発移核に従って率分布が決ま 06 マルコフ連鎖モンテカルロ法(1) 𝜃 𝑡+1 の分布から適当な 𝜃 𝑡+1 をす 8

9.

１ Metropolis-Hastings 略してM-H法 07 マルコフ連鎖モンテカルロ法(2) 9

10.

モンテカルロ法の十分 ▌そもそもモンテカルロ法が常分布に収束すことが約束されには？ 𝑃 𝜃 𝑡+1 = න 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 𝑑𝜃 𝑡 𝑃 𝜃 𝑡+1 𝑃 𝜃 𝑡 𝜃 𝑡+1 が立が立すためには？ = 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 うな𝑃 𝜃 𝑡+1 𝜃 𝑡 を使え良い ▌なぜ？この式の両辺 𝜃 𝑡 で積 𝑃 𝜃 𝑡+1 න 𝑃 𝜃 𝑡 𝜃 𝑡+1 完全に致すると = න 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 𝑑𝜃 𝑡 になため 𝑑𝜃 𝑡 = 全事象の確率の和なので 07 マルコフ連鎖モンテカルロ法(2) 10

11.

突然なですか，この式は ▌詳細釣合いとれますチャハン 𝜃𝑡 = 特定の状態例に考えてみましょ 𝑃 𝜃 𝑡+1 𝑃 𝜃 𝑡 𝜃 𝑡+1 𝑃 𝜃 𝑡+1 𝑡+ で率 𝑡+ 𝜃 𝑡+1 = = 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 × 𝑃 𝜃 𝑡 𝜃 𝑡+1 日目の晩ごはがステキ 𝑃 𝜃𝑡 日目の晩ごはが 𝑡 日目の晩ごはが 𝑡 日目の晩ごはがでのときに 𝑡 + 日目の晩ごはがのときに 𝑡日目の晩ごはがで × 𝑃 𝜃 𝑡+1 𝜃 𝑡 率通常のマルコフ連鎖とはに ← という移が起こ割合 07 マルコフ連鎖モンテカルロ法(2) 率で率通常のマルコフ連鎖に → という移が起こ割合 11

12.

詳細釣合いの例 ▌超シンプルな例晩ごはんは２種類のみには「前の日と同じもの」選びがち，とい想定です詳細釣合いきょきのどの𝜃 𝑡 と𝜃 𝑡+1 の組み合わせでも 0.9 0.1 0.4 0.6 𝑃 𝜃 𝑡+1 𝑃 𝜃 𝑡 𝜃 𝑡+1 = 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 が常に成り立 𝜃 𝑡 = 𝜃 𝑡+1 の時には常に成り立常分布 𝜃 = 5 𝜃 = 5 𝜃𝑡 = だとすと… 𝑃 𝜃 𝑡+1 𝑃 𝜃 𝑡 𝜃 𝑡+1 5 07 マルコフ連鎖モンテカルロ法(2) × ， 𝜃 𝑡+1 = のとき = 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 = 5 × 12

13.

もう少し感覚な理を ▌割合を表すため「100人」を考えてみます。今日の晩ごはんは，20人が常分布 𝜃 ，80人が = 5 𝜃 = 5 20×0.4=8人 72人 12人 80×0.1=8人２の状態ので移す割合がでれ次の時でも各状態の率が変わらないきのきょ 0.9 0.1 0.4 0.6 定常分布が維持されることがわかる明日の晩ごはも，20人が，80人が 07 マルコフ連鎖モンテカルロ法(2) 13

14.

詳細釣合いとンプリング ▌詳細釣合いが立っていとき常分布 𝜃 きょ = 5 𝜃 = 5 きの 0.9 0.1 0.4 0.6 ２の状態の常分布におけ率𝑃 𝜃 𝑡 をもとにして次の時のンプリングは移先の状態の率が高いほど高率で移動す連続分布 0.4 には 0.6 0.9 0.1 移先の状態の率が低いと移動す率も低い 07 マルコフ連鎖モンテカルロ法(2) 14

15.

詳細釣合いを満たす移核を探してこい 𝑃 𝜃 𝑡+1 𝑃 𝜃 𝑡 𝜃 𝑡+1 というわけでが立 = 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 うな𝑃 𝜃 𝑡+1 𝜃 𝑡 を使え良いそれがわかっていたら苦労していないって ▌代わに適当な提案分布𝑄 𝜃 ∗ 𝜃 𝑡 を用意してみます。常分布きの 𝜃 = 5 𝜃 = きょ 5 とすときのきょ 0.9 0.1 0.5 0.5 0.4 0.6 0.5 0.5 真の移核でもわからない 𝑃 𝜃 𝑡+1 𝜃 𝑡 提案分布 𝑄 𝜃∗ 𝜃 𝑡 理上は，提案 07 マルコフ連鎖モンテカルロ法(2) はほぼどんなものでもOKです 15

16.

も釣合わない常分布 𝜃 きの = 5 𝜃 = 𝑃 𝜃 𝑡+1 𝑄 𝜃 ∗ 𝜃 𝑡+1 ≠ 𝑃 𝜃 𝑡 𝑄 𝜃∗ 𝜃 𝑡 5 きょ 5 × 5 ≠ 5 0.5 0.5 𝑃 𝜃 𝑡+1 𝑄 𝜃 𝑡 𝜃 𝑡+1 0.5 0.5 𝑄 𝜃 ∗ 𝜃 𝑡 だけ用意しても詳細釣合い提案分布 𝑄 𝜃∗ 𝜃 𝑡 は満たさない = 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑄 𝜃 ∗ 𝜃 𝑡 𝑃 𝜃 𝑡 𝜃 𝑡+1 = 𝑔 𝜃 𝑡 𝜃 ∗ 𝜃 𝑡 𝑄 𝜃 ∗ 𝜃 𝑡+1 真の移核「何か」と「提案分布」の積に分 𝑃 𝜃 𝑡+1 𝑔 𝜃 𝑡 𝜃 ∗ 𝜃 𝑡+1 𝑄 𝜃 ∗ 𝜃 𝑡+1 5 ≠ 𝑃 𝜃 𝑡 𝑄 𝜃 𝑡+1 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝑃 𝜃 𝑡 𝜃 𝑡+1 と × を考えできるよに，そんな「何か」考えます = 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 = 𝑃 𝜃 𝑡 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑄 𝜃 ∗ 𝜃 𝑡 えここまでは詳細釣合い 07 マルコフ連鎖モンテカルロ法(2) が満たされてい 16

17.

𝑔 ⋅ の役割を感覚に理す ▌再「100人」を考えてみます。今日の晩ごはんは，20人が常分布 𝜃 ，80人が 20×0.5=10人きの 40人 10人 80×0.5=40人 = 5 𝜃 = 5 きょ 0.5 0.5 0.5 0.5 提案分布提案分布を真に受けてしまうと移の発割合のバランスが崩れ 𝑄 𝜃∗ 𝜃 𝑡 定常分布が維持されない明日の晩ごはは，50人が，50人が 07 マルコフ連鎖モンテカルロ法(2) 17

18.

𝑔 ⋅ の役割を感覚に理す（続き） ▌再「100人」を考えてみます。今日の晩ごはんは，20人が 10人 10人きの 100% 10人 10人に，率 75% に 30人部の人をもとに戻す定常分布が維持されるようになる明日の晩ごはは，20人が = 5 𝜃 = 5 きょ 40人 40人 25% 提案常分布 𝜃 ，80人が 0.5 0.5 0.5 0.5 提案分布を補正 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑄 𝜃 ∗ 𝜃 𝑡 採択率，80人が 07 マルコフ連鎖モンテカルロ法(2) 18

19.

具体に 𝑔 ⋅ の形は？ 𝑃 𝜃 𝑡+1 𝑔 𝜃 𝑡 𝜃 ∗ 𝜃 𝑡+1 𝑄 𝜃 ∗ 𝜃 𝑡+1 両 = 𝑃 𝜃 𝑡 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑄 𝜃 ∗ 𝜃 𝑡 を𝑔 𝜃 𝑡 𝜃 ∗ 𝜃 𝑡+1 でわと 𝑃 𝜃 𝑡+1 𝑄 𝜃 ∗ 𝜃 𝑡+1 𝑔 ⋅ のみを左 =𝑃 𝜃𝑡 𝑔 𝜃 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑔 𝜃 𝑔 𝜃 𝑡 𝜃 ∗ 𝜃 𝑡+1 𝑄 𝜃∗ 𝜃 𝑡 に持っていと 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑡 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 ∗ 𝜃 𝜃 𝑡+1 が 𝑡 ∗ 𝜃 𝜃 𝑡+1 = 𝑃 𝜃 𝑡+1 𝑄 𝜃 ∗ 𝜃 𝑡+1 𝑃 𝜃 𝑡+1 𝑄 𝜃 ∗ 𝜃 𝑡+1 𝑃 𝜃𝑡 𝑄 𝜃∗ 𝜃 𝑡 𝑃 𝜃 𝑡 𝑄 𝜃∗ 𝜃 𝑡 でれ詳細釣合い 07 マルコフ連鎖モンテカルロ法(2) が保たれ 19

20.

具体に 𝑔 ⋅ の形は？（づき）採択２の採択率そのものではな率の比に 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑔 𝜃𝑡 𝜃 ∗ 𝜃 𝑡+1 がもし提案分布が 𝑃 𝜃 𝑡+1 𝑄 𝜃 ∗ 𝜃 𝑡+1 𝑃 𝜃𝑡 𝑃 𝜃 𝑡+1 = 𝑃 𝜃𝑡 𝑄 𝜃∗ 𝜃 𝑡 常分布𝑃 𝜃 におけ現在の状態の 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑔 𝜃 でれ詳細釣合い 𝑄 𝜃∗ 𝜃 𝑡 な分布でれ 𝑃 𝜃 𝑡+1 𝑄 𝜃 ∗ 𝜃 𝑡+1 𝑃 𝜃𝑡 す制約 𝑡 ∗ 𝜃 𝜃 𝑡+1 正確には，ここで称な（𝑄 𝜃 ∗ 𝜃 𝑡+1 = 𝑄 𝜃 ∗ 𝜃 𝑡 とな）提案分布用いたものはメトロポリス法と呼ばれます。 MH法は，𝑄 𝜃 ∗ 𝜃 𝑡+1 含めて定式化することで提案分布が称でない合にも般化された方法です。まり率 𝑃 𝜃 𝑡+1 = 𝑃 𝜃𝑡 が保たれと移先の状態の = 07 マルコフ連鎖モンテカルロ法(2) 率移先の状態の率現在の状態の率の比 20

21.

例 ▌ 常分布が 𝜃 = 𝜃 5 いったん𝜃 𝑡 = 5 の合， 𝜃 ∗ 𝜃 𝑡+1 との移の採択 𝑃 𝜃 𝑡+1 = 𝑃 𝜃𝑡 = 単純に，定常上の確率の比が4倍，といだけのときの採択率が 10人 100% 10人 75% 10人 80% ４倍 40人 25% p. 17 のときの４倍になれ良い！ 8人 10人４倍率は？とすると 𝜃 𝑡+1 = 𝑔 𝜃 𝑡+1 𝜃 ∗ 𝜃 𝑡 𝑔 𝜃𝑡 = 2人 20% 40人 5% 30人他の 07 マルコフ連鎖モンテカルロ法(2) 例 2人 95% 38人 21

22.

実際にはのときの採択率が 10人 100% 75% 10人 80% ４倍 40人 25% 10人 8人 10人４倍 p. 17 のときの４倍になれ良い！ 2人 20% 40人 5% 30人他のメトロポリス法では率の低い方から高い方への移率を100%として低い方への移率を𝑓 𝜃 の比に基づいて決め 07 マルコフ連鎖モンテカルロ法(2) 例 2人 95% 38人両方の採択率が100%未満の合ンプリングが必要以上に動かないため効率が良ないかもしれない 22

23.

Metropolis-Hastings法の手 ① 提案分布𝑄 𝜃 ∗ 𝜃 𝑡 から ② てきた𝜃 ∗ にいて発させ率min 𝑃 𝜃∗ 𝑃 𝜃𝑡 p. 19 このので𝑄 𝜃 𝜃 を無視すため，分布正規分布からをとラクです ∗ 𝑡 で採択すの定理使って書き直すと 𝑃 𝜃∗ 𝑃 𝜃𝑡 事２分布の 𝑃 𝑌 𝜃∗ 𝑃 𝜃∗ 𝑃 𝑌 = 𝑃 𝑌𝜃𝑡 𝑃 𝜃𝑡 𝑃 𝑌 = 𝑃 𝑌 𝜃∗ 𝑃 𝜃∗ 𝑃 𝑌𝜃𝑡 𝑃 𝜃𝑡 𝜃 𝑡 と𝜃 ∗ の２にいて普通に尤度×事前分布のをすだけなのでかた正規化が消えのでの率（密度） 𝑃 𝜃 𝑡 は分からなてもの率（密度）の比は簡単にでき！ 07 マルコフ連鎖モンテカルロ法(2) 23

24.

Metropolis-Hastings法の手 ① 提案分布𝑄 𝜃 ∗ 𝜃 𝑡 からくりかえす ② てきた𝜃 ∗ に ③ 採択すいて p. 19 発させ率min 𝑃 𝜃∗ 𝑃 𝜃𝑡 このので𝑄 𝜃 𝜃 を無視すため，分布正規分布からをとラクです ∗ で採択す合は𝜃 𝑡+1 = 𝜃 ∗ とな，採択しない 𝑃 𝜃∗ > 𝑃 𝜃 𝑡 の合， 𝑡 合は𝜃 𝑡+1 = 𝜃 𝑡 率１で（必）採択す 10人 10人 100% 𝑃 𝜃 = 5 𝑃 𝜃∗ < 𝑃 𝜃 𝑡 40人 25% 10人の 𝑃 𝜃 75% 合，採択しないことも 07 マルコフ連鎖モンテカルロ法(2) = 5 30人 𝜃 𝑡 に戻 24

25.

Metropolis-Hastings法のイメ提案された候補の事率密度𝑃 𝜃 ∗ が 𝑃 𝜃𝑡 低い合率に棄却され 𝑃 𝜃∗ min < 𝑃 𝜃𝑡 𝜃 𝑡 をもとに提案分布𝑄 𝜃 ∗ 𝜃 𝑡 からを発提案された候補の事率密度𝑃 𝜃 ∗ が 𝑃 𝜃𝑡 高い合必採択され 𝑃 𝜃∗ min = 𝑃 𝜃𝑡 率密度の高いとこほどンプリングされすい提案分布 07 マルコフ連鎖モンテカルロ法(2) 25

26.

𝜃 𝑡+1 の率分布を無理率に棄却されと 𝜃 𝑡+1 = 𝜃 𝑡 となために 𝜃 𝑡 とな率が高い書いてみたら正なスルで描と，このはもっと高いとこにますこな感の率分布を 𝜃 𝑡 に応て毎回っていうなもの 𝜃 𝑡 をもとに提案分布𝑄 𝜃 ∗ 𝜃 𝑡 からを発 07 マルコフ連鎖モンテカルロ法(2) 26

27.

とえ ▌ 例ってみ 05でった「コンビニの売上」をってみますコンビニチェンのアナリストは，各店舗の利益に影響す要因を調べことにしました。その第歩として，まは母集団（全店舗）での利益の平均と分散を測したいといます。なお，利益はふう正規分布に従うと言われていとします。事分布のプロットどらを使ってもですストグラムカル密度ほぼ無情報事前のときの解析な事後 𝑃 𝜇 𝜎2 𝒙 ∝ 𝑁 𝑃 𝜎 2 𝒙 ∝ 𝐼𝑛𝑣𝐺𝑎𝑚𝑚𝑎 5 𝜎2 5 33 3 これらいの事分布がてきてれたら功な 07 マルコフ連鎖モンテカルロ法(2) 27

28.

ってみましょう【用意すもの】 ▌（共役ではない）事前分布 𝑃 𝜎 2 = 𝐼𝑛𝑣𝐺𝑎𝑚𝑚𝑎 𝑃 𝜇 =𝑁 ▌提案分布 𝑄 𝜇∗ 𝜇 𝑡 ∗ 2 𝑄 𝜎 𝜎𝑡 ほぼ無情報事前分布を設しておきます採択率のをラクにすため，「前の時から±0.1の範囲」の = 𝑈𝑛𝑖𝑓 𝜇 𝑡 − 𝜇𝑡 + = 𝑈𝑛𝑖𝑓 𝑡 2 𝜎 𝑡 2 𝜎 マルコフ連鎖には，初 − 分布としました + は何でも良いはです ▌初 𝜇0 = 0 2 𝜎 = 07 マルコフ連鎖モンテカルロ法(2) 28

29.

改めて手を認 ① 提案分布𝑄 𝜃 ∗ 𝜃 𝑡 からくりかえす発させ今回はそれぞれのパラメータ 𝑈𝑛𝑖𝑓 𝜃 𝑡 − ② てきた𝜃 ∗ にいて 𝑃 𝜃∗ 𝑃 𝜃𝑡 ③ 採択す率min = 𝑃 𝜃∗ 𝑃 𝜃𝑡 𝜃𝑡 + から発生で採択す尤度事前分布 ∗ ∗ ∗ 2 ∗ 2 𝑃 𝑌𝜇 𝜎 𝑃 𝜇 𝑃 𝜎 𝑃 𝑌 𝜇 𝑡 𝜎2 𝑡 𝑃 𝜇 𝑡 𝑃 𝜎2 合は𝜃 𝑡+1 = 𝜃 ∗ とな，採択しない 07 マルコフ連鎖モンテカルロ法(2) 𝑡 合は𝜃 𝑡+1 = 𝜃 𝑡 29

30.

[beta]

（補足）M-H法のRコ ド
▼準備・

ラメ タ設

# M-H sampling
for(s in 2:S){

# データの読み込み

mu_now <- samples$mu[s-1]

dat <- read.csv("data_cvs.csv")

sigma2_now <- samples$sigma2[s-1]

SALES <- dat$sales

# 更新の提案
mu_prop <- runif(1, mu_now-w_prop, mu_now+w_prop)

# initial value

sigma2_prop <- runif(1, sigma2_now-w_prop, sigma2_now+w_prop)

mu_init <- 1; sigma2_init <- 1

if(sigma2_prop < 0) sigma2_prop <- 0.0001

# サンプリング回数

# 採択確率の計算

S <- 10000

# 提案された箇所の対数確率密

# サンプリング結果 入れてお 箱(data.frame)

lp_prop = sum(dnorm(SALES, mu_prop, sqrt(sigma2_prop), log = TRUE)) +

# is_acceptedは提案された値が採択されたか 格納してお 列

dgamma(1/sigma2_prop, 0.001, 0.001, log = TRUE) +

samples <- data.frame(mu = rep(NA,S), sigma2 = NA, is_accepted = NA)

dnorm(mu_prop, 0, 100000, log = TRUE)

samples[1, c("mu","sigma2")] <- c(mu_init, sigma2_init)

# 現在の箇所の対数確率密

w_prop <- 0.1 # 提案 一様

lp_now = sum(dnorm(SALES, mu_now, sqrt(sigma2_now), log = TRUE)) +

の広さ

dgamma(1/sigma2_now, 0.001, 0.001, log = TRUE) +
dnorm(mu_now, 0, 100000, log = TRUE)
prob <- exp(lp_prop - lp_now)
if(runif(1) < prob){

samples[s,] <- c(mu_prop, sigma2_prop, TRUE)
} else {
samples[s,] <- c(mu_now, sigma2_now, FALSE)
}

本体

}

07 マルコフ連鎖モンテカルロ法(2)

30

31.

を見てみ plot(samples$mu,type="l") plot(samples$mu, samples$sigma,type="l") 常っぽ見え常っぽ見え初初トレスプロットンプリングの動きどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 31

32.

これをベイズに適用できれはめのほうのンプリングもしも 06 p. 40 常分布が事分布だったら初の方のンプリングの初（初率はたすらの影響を受けにってとこからは率が変わ）「常分布からのランダムンプリングとは言えないすと，常分布に移行す。前の」から率「に決しても常分布」からのランダムンプリングとみなすことができ当然この部分だけ使え「事分布からの」に初の方は初モンテカルロ法が使えに依存すので，事！分布の復元には程度経ってからのンプルのみを使用しますマルコフ連鎖モンテカルロ法設した初実際に何回捨てる必要があるかは・デタにます・アルゴリズムにます・モデルにます・事前分布にます・にます・初にます etc… 07 マルコフ連鎖モンテカルロ法(2) 32

33.

初をすてて事分布 M-H法に事分布 plot(density(samples$mu[-(1:1000)])) 05 p. 95 共役事前分布から導事分布からのしたどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 33

34.

初をすてて事分布 M-H法に事分布 plot(density(samples$sigma[-(1:1000)])) 05 p. 95 共役事前分布から導事分布からのしたどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 34

35.

提案分布の重要性「±0.02の範囲」の一様「±0.1の範囲」の一様の場合の場合おそすぎうまい「±3の範囲」の一様の場合各ステップの幅（ステップイズ）が • 小さいとサンプリング効率が悪なるカクカクしてい採択率が低い • 大きてもサンプリング効率は悪なる適切な設を探す必要が 07 マルコフ連鎖モンテカルロ法(2) 35

36.

提案分布を決めためにンプリング効率を考えてみます ▌MCMCにおけ高効率事分布から直接を事す方法のンプルが独立に情報を与えため効率低効率「±0.02の範囲」の 2 1 分布を用いたM-H法の分布全体から縦横無尽にンプリングでき合動きが遅すぎるとサンプリング効率が悪い 1 初 2 に依存してい時が長いから常分布に到達した前のもを引きっていから「前の 07 マルコフ連鎖モンテカルロ法(2) 少ししか移動できないので事分布全体を網羅すには時がかかのですを引きってい」程度を化してみてみます 36

37.

自己相 (autocorrelation) ▌n個前のンプルとの相高効率事分布から直接係をす方法毎回ランダムンプリングなのでも低効率「±0.02の範囲」の分布を用いたM-H法の実際にしてみと… 自己相は0 合 40個前のンプルともおそ0.97の相が acf(samples$mu) 07 マルコフ連鎖モンテカルロ法(2) 37

38.

自己相 (autocorrelation) ▌n個前のンプルとの相高効率事分布から直接係をす方法毎回ランダムンプリングなのでも低効率「±0.02の範囲」の分布を用いたM-H法の自己相は0 合極端な話をすと acf(samples$mu) う 𝑠= 3000個前までとの自己相をしてみた事 07 マルコフ連鎖モンテカルロ法(2) 2500個前らいで自己相はほぼ０にな 5 5 75 ⋯ を2500個おきに使ってっと分布から直接をす方法とといえ 38

39.

自己相に基づステップイズの決 ▌自己相が低いほどンプリング効率が良い提案の幅色々と変えて自己相関 lag=40 自己相 (lag=40) 幅が狭すぎると移動に時間がかかる自己相幅が広すぎると棄却されやすなる棄却された場合前回とにな自己相このたがベスト計算してみます提案分布青： 𝑃 𝜃 ∗ < 𝑃 𝜃 𝑡 赤： 𝑃 𝜃 ∗ ≥ 𝑃 𝜃 𝑡 提案の幅が広すぎると 𝑃 𝜃 ∗ が高なうな𝜃 ∗ が提案され率が低な提案分布の幅 07 マルコフ連鎖モンテカルロ法(2) 39

40.

認）採択率と自己相 ▌自己相が低いほどンプリング効率が良い提案の幅色々と変えて自己相関 lag=40 計算してみます (lag=40) ステップイズの決め方自己相（提案の幅が広すぎると採択率は低なるいろいろなステップサ短いMCMC 回す自己相で採択率と自己相提案の幅が狭すぎると採択率は高なるが一歩一歩が小さいこのたがベスト自己相採択率 07 マルコフ連鎖モンテカルロ法(2) がいい感になステップイズを見け決定したステップサ長いMCMC 行で適な採択率はモデルに試行錯誤すしかない 40

41.

２ Gibbs Sampling 07 マルコフ連鎖モンテカルロ法(2) 41

42.

できことなら ▌事分布が直接導できれそこからをせ良い例えば2 のパラメータの事後がこんな感じとわかっていたとしてそこから同時に乱数ればいい同時事後分布から乱数が作れたら…の話 07 マルコフ連鎖モンテカルロ法(2) 42

43.

実際には時分布を導すのは構しどいことが ▌ 重回帰析らいでもパラメータの数が増えるとらい ▌導できてもを例えば「正規「ータにしづらいことがにパラメータ」「ンマパラメータ」の3 を時ににパラメータ」できか？多無理一つずつ順番に乱数を作るほうがまだ望みがある 𝜇 𝜎2 を時に 𝜇 だけをンプリング 𝜎 2 だけをンプリングのかわに 07 マルコフ連鎖モンテカルロ法(2) 43

44.

Gibbs Sampling ▌こな時に使えますパラメータ数が多すぎて同時事後全てのパラメータの同時事後でも【例】ラメタごとのが作れないときが作れるけど意味不明な乱数作れないときき分布はでき，がラメタを２に分けて考え（𝜽 = {𝜽1 𝜽2 }）時事分布はベイズの理に当てはめれすいとき ※ 𝜽はクトルでも問題ない 𝜽1 = 𝛼 𝛽 𝜽2 = {𝛾}とかでもOK 頑張れ可能 𝑃 𝒀 𝜽1 𝜽2 𝑃 𝜽1 𝜽2 𝑃 𝜽1 𝜽2 𝒀 = 𝑃 𝑌 07 マルコフ連鎖モンテカルロ法(2) 44

45.

Gibbs Sampling 「ラメタごとの事き分布はでき，がすい」とは… 分布 𝑃 𝜽1 𝜽2 𝒀 は扱いにいが 𝑃 他のラメタを所与とした 𝑡 𝑡−1 𝑡 𝜽1 𝜽2 𝒀 と𝑃 𝜽2 き分布 𝑡−1 𝜽1 𝒀 なら扱いすいということ【例】正規分布の平均 𝜇 と分散 𝜎 2 の • 時事分布 𝑃 𝜇 𝜎 2 𝒙 は扱いにいが ※第5回では「𝑃 𝜎 2 𝒙 から 𝜎 2 のサンプリング」→「𝑃 𝜇 𝜎 2 𝒙 から 𝜇のサンプリング」の2段階で行いました。これは，「正規と逆ンマ • 𝑃 𝜇 𝑡 𝜎2 𝑡−1 から同時に乱数作ることは難しい」ためです。 𝒙 と𝑃 𝜎 2 𝑡 𝜇 𝑡−1 𝒙 なら扱いすい ※気をけてほしいのは，赤い分布と青い分布は別だということです。 07 マルコフ連鎖モンテカルロ法(2) 45

46.

違う分布？ ▌平均ラメタ 𝜇 にいて第5回で導出した理ギブスのための条件付き 𝜇𝑡 𝜎 は𝑃 どらも 𝜎 2 を何らかの ▌分散は 𝑃 𝜇 𝜎2 𝒙 な事後に固 2 𝑡−1 した（ 𝒙 𝜎 2 𝑡 − 回目のサンプリングに固定した上での 𝜇 のけた） 𝜇 の分布似てラメタ 𝜎 2 にいて第5回で導出した理 𝜇のでな事後けられていないギブスのための条件付き 𝜇のでは 𝑃 𝜎2 𝒙 は𝑃 𝜎 2 𝑡 𝜇 𝑡−1 𝒙 少し違うけられてい 07 マルコフ連鎖モンテカルロ法(2) 46

47.

分布の比較平均ラメタラメタ𝜎 2 の分散 𝜇 共役事前理論な事分布 05 p. 85 𝜏 ｜𝜇 ∼ 𝑁 𝜎2 𝜇0 𝑛0 𝑃 𝜇 𝜎 𝒙 𝜇0 𝑛0 𝜈0 𝜎0 𝑛0 𝜇0 + 𝑛𝑥ҧ 𝜎 2 =𝑁 𝑛0 + 𝑛 𝑛0 + 𝑛 準共役で独立な事前｜𝜇 ∼ 𝑁 𝜏 ∼ 𝐺𝑎𝑚𝑚𝑎 𝜈0 𝜈0 𝜎02 2 2 おいた場合 𝑃 𝜏 𝒙 𝜈0 𝜎02 = 𝐺𝑎𝑚𝑚𝑎 1 𝜇0 𝜏0 2 𝜈0 + 𝑛 𝜈0 𝜎0 + 𝑛 − 𝜏 ∼ 𝐺𝑎𝑚𝑚𝑎 𝜈0 𝜈0 𝜎02 2 2 𝑠𝑥2 + 𝑛0 𝑛 𝑥ҧ − 𝜇0 2 𝑛0 + 𝑛 おいた場合 05 p. 72 ギブスのためのき分布 𝑃 𝜇 𝑡 𝜏 𝑡−1 𝒙 𝜇0 𝜎02 𝜈0 𝜎0 𝜏0 𝜇0 + 𝑛𝜏 𝑡−1 𝑥ҧ =𝑁 𝜏0 + 𝑛𝜏 𝑡−1 𝜏0 + 𝑛𝜏 𝑡−1 𝑃 𝜏 𝑡 𝜇 𝑡−1 𝒙 𝜇0 𝜎02 𝑛0 𝛾0 = 𝐺𝑎𝑚𝑚𝑎 07 マルコフ連鎖モンテカルロ法(2) 𝜈0 + 𝑛 𝜈0 𝜎02 + σ𝑛𝑖=1 𝑥𝑖 − 𝜇 𝑡−1 47 2

48.

ギブスンプラの目 ▌もともとのMCMCが = න 𝑃 𝜃 𝑡 𝑃 𝜃 𝑡+1 𝜃 𝑡 𝑑𝜃 𝑡 が成り立よに移核設定することだった 𝑃 𝜃 𝑡+1 事（たいことは分布常分布） ▌正規分布の 𝑃 𝜇 𝑡+1 𝜏 𝑡+1 移核スでは2変なので = න 𝑃 𝜇 𝑡 𝜏 𝑡 𝑃 𝜇 𝑡+1 𝜏 𝑡+1 𝜇 𝑡 𝜏 𝑡 𝑑𝜇𝑑𝜏 以下のうに置き換えと式が 𝑃 𝜇 𝑡+1 𝜏 𝑡+1 𝜇 𝑡 𝜏 𝑡 𝜇 𝜏 の（移率は 𝑡 回目のンプリングのみに依存して決まため，かにこれはマルコフ連鎖なのです時）移核立のです = 𝑃 𝜇 𝑡+1 𝜏 𝑡+1 𝜇 𝑡 𝜏 𝑡 𝑃 𝜏 𝑡+1 𝜇 𝑡 𝜏 𝑡 𝜏 を固した 𝜇の（時）移核 07 マルコフ連鎖モンテカルロ法(2) 𝜇 を固した 𝜏の（時）移核 48

49.

ギブスンプラの手 ① とえ初 𝜇 0 𝜏 0 を決め ② 初を使って𝜇 = 𝜇 0 に固 𝜏のき事分布した状態で𝑃 𝜏 1 𝜇 0 𝒙 から𝜏 ∗ を ③ てきた𝜏 ∗ = 𝜏 1 として𝑃 𝜇 1 𝜏 1 𝒙 から𝜇∗ を発させ ④ てきた𝜇∗ = 𝜇 1 として𝑃 𝜏 2 𝜇 1 𝒙 から𝜏 ∗ を発 ⑤ ③と④をたすら発させさせす 𝜇のき事分布に基づいて 𝜇1 𝜇2 𝜇3 𝜇4 𝜏のき事分布に基づいて 𝜏1 𝜏2 𝜏3 𝜏4 07 マルコフ連鎖モンテカルロ法(2) … 𝜇𝑆 𝜏𝑆 49

50.

[beta]

（補足）Gibbs SamplingのRコ ド
▼準備・

▼本体

ラメ タ設

# データの読み込み

# Gibbs sampling

dat <- read.csv("data_cvs.csv")

for(s in 2:S){

SALES <- dat$sales

# muの条件付き事後
mean_s <- (tau0*mu0 + n*samples$tau[s-1]*mean_Y)/(tau0 + n*samples$tau[s-1])

# initial value

sd_s <- 1/sqrt(tau0 + n*samples$tau[s-1])

mu_init <- 1

# 条件付き事後

tau_init <- 1

#

sigmaの逆数 の初期値

から普通に乱数生成

samples$mu[s] <- rnorm(1, mean_s, sd_s)

# prior distribution

# sigmaの条件付き事後

mu0 <- 0

alpha_s <- (nu0 + n)/2

tau0 <- nu0 <- 0.001

beta_s <- (nu0 * sigma0 + sum((SALES-samples$mu[s])^2))/2

sigma0 <- 1

# 条件付き事後

# サンプリング回数

samples$tau[s] <- rgamma(1, alpha_s, beta_s)

S <- 10000

から普通に乱数生成

}

# sigmaに戻す
# サンプリング結果 入れてお 箱(data.frame)

samples$sigma2 <- 1/samples$tau

# 計算時にはtau 使 が，関心があるのはsigma2
samples <- data.frame(mu = rep(NA,S), tau = NA, sigma2 = NA)
samples[1,c("mu","tau")] <- c(mu_init, tau_init)

# 繰り返し必要な計算は先にやってお
n <- length(SALES)
mean_Y <- mean(SALES)

07 マルコフ連鎖モンテカルロ法(2)

50

51.

を見てみ plot(samples$mu,type="l") plot(samples$mu, samples$sigma,type="l") 常っぽ見え常っぽ見え初初トレスプロットンプリングの動きどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 51

52.

初をすてて事分布 Gibbsに事分布 plot(density(samples$mu[-(1:200)])) 05 p. 95 共役事前分布から導事分布からのしたどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 52

53.

初をすてて事分布 Gibbsに事分布 plot(density(samples$sigma[-(1:200)])) 05 p. 95 共役事前分布から導事分布からのしたどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 53

54.

M-H法とGibbs ▌Gibbsの利 M-H法に言えば採択率が必ず1になるステップサ効率なことが多い決める必要がない ▌M-H法の利条件付き事後の形がからなても使える ▌組み合わせても良い条件付き事後が導出できるパラメータはGibbsでサンプリングしてそでないパラメータはM-H法で ▲ これを交互にすのもアリ 07 マルコフ連鎖モンテカルロ法(2) 54

55.

３ Hamiltonian Monte Carlo いい stanの身に迫 07 マルコフ連鎖モンテカルロ法(2) 55

56.

M-Hの弱 ▌M-Hがうま機能すためには自己相パラメータが十なスピードで動き必要があり，そのために一様であれば適切な幅をめ必要がに基づステップイズの決採択される確率が低すぎない自己相が低いほどンプリング効率が良い提案の幅色々と変えて自己相関計算してみます p. 39 幅が狭すぎると移動に時間がかかる自己相幅が広すぎると棄却されやすなる棄却された場合前回とにな自己相自己相このたがベスト適切な幅はパラメータのスケールによるのでパラメータごとに決める必要がある提案分布青：赤： < パラメータがいっぱいあったら全部手業で探さないといけないですか？提案の幅が広すぎるとが高なうなが提案され率が低な提案分布の幅マルコフ連鎖モンテカルロ法 07 マルコフ連鎖モンテカルロ法(2) 56

57.

の問題はなので多変でM-H法を使う合 Gibbsのうに変を分割してに更新していことが多いです ▌採択率が低すぎこと１変の合，少なとも半分の率で今も事密度が低いが提案されてしまう今多変になほども事密度が高いはにな青： 𝑃 𝜃 ∗ < 𝑃 𝜃 𝑡 赤： 𝑃 𝜃 ∗ ≥ 𝑃 𝜃 𝑡 提案分布そもそも事密度の高いが提案されすかったら良いのでは？ 07 マルコフ連鎖モンテカルロ法(2) 57

58.

突然ですが物理の話 ▌お椀型の地形がったとさこのッカボルを左に蹴とどうな？坂で勢いを失って右に戻った行った来たして終に谷底で止ま 07 マルコフ連鎖モンテカルロ法(2) 58

59.

物体がもエルギ ▌高校物理でて力学らしい話エルギ位置エルギ＋運動エルギまたの名をハミルトニアン出発して𝜏秒後の ℎ 𝜏 高さ ℎ 𝜏 ，位置 𝜃 𝜏 としますハミルトニアンを 𝐻 𝜏 位置エルギを 𝑈 𝜏 運動エルギを 𝐾 𝜏 𝜃 𝜏 𝐻 𝜏 =𝑈 𝜏 +𝐾 𝜏 07 マルコフ連鎖モンテカルロ法(2) 59

60.

エルギ力学エルギ 𝐻 𝜏 位置エルギ = 𝑈 𝜏 ＋運動エルギ + 𝐾 𝜏 ▌【位置エルギ】 𝑈 𝜏 =質重いものほど，高いとこに × 重力加速度 × 高さ = 𝑚𝑔ℎ 𝜏 ものほど位置エネルギーが大きい ▌【運動エルギ】 𝐾 𝜏 = ×質 × 速さ 2 = 𝑚𝑣 𝜏 2 = 重いものほど，速いものほど運動エネルギーが大きい 07 マルコフ連鎖モンテカルロ法(2) 𝑚 𝑝 𝜏 2 運動をの変で表すため 𝑝 𝜏 = 𝑚𝑣 𝜏 = 質 × 速さとして変形しています（ニュトンの運動方程式） 60

61.

エルギ保存の法則力学エルギ 𝐻 𝜏 位置エルギ = 𝑈 𝜏 摩擦などがなけれ，常に𝐻 𝜏 が＋運動エルギ + 𝐾 𝜏 に保たれ ℎ 𝜏 理想な状況では，どな強さでボルを弾いたら，何秒にどこまでどれらいの速さで転がかこの高さにボルを左に0.5の強さで蹴ったら（摩擦空気抵抗などが無けれ） 𝜏 秒にはょうどここにはが全て計算できるといこと 𝜃 𝜏 07 マルコフ連鎖モンテカルロ法(2) 61

62.

なぜ急に物理の話をしたのか？ ▌もしもここまでの考え方を事分布上で表現できたら？事分布をとってっすとこのッカボルを適当な強さで蹴って 𝜏 秒の位置を録す 𝜏秒 07 マルコフ連鎖モンテカルロ法(2) の位置 𝜃 𝜏 をンプリングす 62

63.

なぜ急に物理の話をしたのか？ ▌もしもここまでの考え方を事分布上で表現できたら？この手続き繰り返せば𝜏 秒後の位置 𝜃 𝜏 は開始時の位置（時前のンプリング）のみに依存すサンプリングになる次はここから再ッカボルを適当な強さで蹴って 𝜏 秒の位置を録すマルコフ連鎖で，局M-Hと比べて何が嬉しいのか？ 𝜏秒の位置 𝜃 𝜏 をンプリングす 07 マルコフ連鎖モンテカルロ法(2) 63

64.

M-H法との比較 Metropolis-Hastings法実際にはもとの事後計算が行われます物理学にづいてな考え方エルギ保存の法則のおかげでボルの位置をすこと自体はとても簡単です蹴方向と強さ提案分布今次の候補ただランダムに決めるのでも率密度の高いとこが選れ率が高ない提案が棄却されことが多い時効率 07 マルコフ連鎖モンテカルロ法(2) 変な方向に蹴ったとしてもが経てボルは低いとこにいことが多いはなンプリングになが 64

65.

ょっと式変形発して𝜏秒の高さをℎ 𝜏 ，位置を𝜃 𝜏 とすと 𝜃 𝜏 がわかれ自動 ℎ 𝜏 摩擦などが無ければ，一蹴ったボールは範囲を無限に行った来たする時の位置からその高さはできにℎ 𝜏 もわか ℎ 𝜏 = ℎ 𝜃 𝜏 とおさらに旦𝜏も消して考えてみさらにさらに質と重力加速度がそれぞれ１でと仮すと（𝑚 = 𝑔 = ）位置エルギ運動エルギ 𝑈 𝜏 =ℎ 𝜃 𝐾 𝜏 = 𝐻 𝜃 𝑝 =ℎ 𝜃 + 𝜃 𝜏 𝑝2 𝑝2 ハミルトニアンは位置𝜃と運動 07 マルコフ連鎖モンテカルロ法(2) 𝑝にで表現され 65

66.

Hamiltonian Monte Carlo ▌ベイズに戻ます。事分布𝑃 𝜃 𝑌 と，独立な標準正規分布𝑃 𝑝 の時分布を考え ※𝑝は𝜃と無関係に生成される乱数あってもなても事後には影響しない 𝑃 𝜃 𝑝𝑌 =𝑃 𝜃𝑌 𝑃 𝑝 𝑃 𝜃 𝑝𝑌 =𝑃 𝜃𝑌 log 𝑃 𝜃 𝑝 𝑌 = log 𝑃 𝜃 𝑌 + log 𝑃 𝑝 標準正規 ∝ log 𝑃 𝜃 𝑌 − 𝑝2 − log 𝑃 𝜃 𝑌 = ℎ 𝜃 とすると 𝑃 𝑥 = の確率密関数は 𝑥2 exp − 𝜋 𝑥2 = −ℎ 𝜃 − 𝑝2 カーネルの対数取ると − 2 = −𝐻 𝜃 𝑝 𝑃 𝜃 𝑝 𝑌 = exp −𝐻 𝜃 𝑝 事まり「まるで蹴ったボールの位置記録するかのよに」事後 07 マルコフ連鎖モンテカルロ法(2) 分布とハミルトニアンが繋がった！からのサンプリングができる，といこと 66

67.

HMCのアルゴリズム ① 適当なとこ 𝜃 0 に ② をお（初）を適当な強さで適当な方向に蹴運動量𝑝 𝑡 これが「事後 ④ また与えるとは独立な標準正規 ③ しらしたら分布にって低いとこ 𝑃 𝑝 からの乱数」 𝑡+ を止めて位置𝜃 𝑡 を録を𝑝 𝑡+1 では事 𝑡 事蹴方向と強さ → 𝜃 𝑡+1 を録られた傾斜のおかげで基本には率密度が高いとこに集ますい 07 マルコフ連鎖モンテカルロ法(2) 67

68.

ハミルトニアンは変わらない時点𝑡で𝜃 𝑡 にいたが𝑝 𝑡 = − のパワーで蹴られたらハミルトニアンの地図（内側ほど𝐻 𝜃 𝑝 が低い） 𝑝 𝜏 𝜃𝑡 蹴られた瞬とハミルトニアン𝐻 𝜃 𝑝 が 𝜃 𝑝 の組み合わせの集合 -1.6 𝜃𝑡 07 マルコフ連鎖モンテカルロ法(2) 𝜃 𝜏 68

69.

ハミルトニアンは変わらない時点𝑡で𝜃 𝑡 にいたが𝑝 𝑡 = − のパワーで蹴られたら • まずちょっと左に行ことする摩擦などが無ければ等高線上をぐぐ回続け • でも傾斜がきいのですごい勢いで右に転がってい • 同じ高さまで到達したらまた左に動き出す • しばらしたら𝜃 𝑡+1 にいる …そしてまた適当なパワーで弾かれてい … ハミルトニアンの地図（内側ほど𝐻 𝜃 𝑝 が低い） 𝑝 𝜏 ＋方向に動力を持ってい 𝜃𝑡 𝜃 𝑡+1 𝑝 𝑡+1 = －方向に動力を持ってい -1.6 𝜃𝑡 07 マルコフ連鎖モンテカルロ法(2) 𝜃 𝑡+1 𝜃 𝜏 69

70.

位置ができ位置𝜃と蹴った強さ𝑝がわかれ，何秒にどこにいて 𝜃 𝜏 どれだけの運動量持っているか 𝑝 𝜏 ができ 𝑝 𝜏 ハミルトンの運動方程式 𝑑𝑝 𝜏 = −ℎ′ 𝜃 𝜏 𝑑𝜏 𝑑𝜃 𝜏 =𝑝 𝜏 𝑑𝜏 運動の変化率は高さの分斜面の傾きで決ま位置の変化率は運動で決ま -1.6 どらも変化率が時 𝜏 に応て変化すのでちょっとずつ動かしながらしてい 07 マルコフ連鎖モンテカルロ法(2) 𝜃𝑡 𝜃 𝑡+1 𝜃 𝜏 70

71.

実際のは少し動かしながら ▌リプフロッグ法リプフロッグは「馬跳」という意味位置の変化率 𝑑𝜃 𝜏 =𝑝 𝜏 𝑑𝜏 運動 𝑑𝑝 𝜏 = −ℎ′ 𝜃 𝜏 𝑑𝜏 運動量と位置交互に計算していと𝑝 𝜃 1 秒 2 から 1 の位置𝜃 2 をす 1 𝜃 2 と𝑝 3 秒 2 から 3 の位置𝜃 2 をす ︙ 𝜃 1 𝜏−2 1 𝜏 + 2秒 1 𝜃 と𝑝 から 2 1秒の運動 𝑝 をす 1 𝜏+2 𝑝 𝜏 3 𝜃 2 と𝑝 から 2秒の運動 𝑝 をす ︙ と 𝑝 𝜏 からの位置𝜃 をすの変化率 1 𝜏+2 -1.6 𝜃 と 𝑝 𝜏 から 𝜏 + 秒の運動 𝑝 𝜏+ をす 07 マルコフ連鎖モンテカルロ法(2) 𝜃𝑡 𝜃 𝜏 71

72.

ょっと動かしながら ▌リプフロッグ法リプフロッグは「馬跳」という意味位置の変化率 𝑑𝜃 𝜏 =𝑝 𝜏 𝑑𝜏 運動 𝑑𝑝 𝜏 = −ℎ′ 𝜃 𝜏 𝑑𝜏 運動量と位置交互に計算していの変化率【開始時】 𝜃 𝑝 【 =𝜃 =𝑝 + 𝑝 𝑝 𝜏 − ℎ′ 𝜃 す】 𝜃 𝜏+ =𝜃 𝜏− +𝑝 𝜏 -1.6 𝑝 𝜏+ = 𝑝 𝜏 − ℎ′ 𝜃 𝜏 + 𝜃𝑡 07 マルコフ連鎖モンテカルロ法(2) 𝜃 𝜏 72

73.

嬉しいポイント ▌蹴った 𝜏秒の位置と運動 ① ハミルトニアンは変わらない 𝑃 𝜃 𝑡 𝑝 𝑡 𝑌 = exp −𝐻 𝜃 ② リプフロッグしていと等高線上をぐぐ回だけ 𝑝 = 𝑃 𝜃 ∗ 𝑝∗ 𝑌 = exp −𝐻 𝜃 𝜏 𝑝 𝜏 交互にすなら，𝜃 ∗ からスタトしても矢印を全部にすことで時 𝜏で𝜃 𝑡 に戻は，ということ 𝑃 𝜃 ∗ 𝑝∗ 𝜃 𝑡 𝑝 𝑡 ▌ 以上 𝜃 𝜏 𝑝 𝜏 をンプリング候補 𝜃 ∗ 𝑝∗ とすと… = 𝑃 𝜃 𝑡 𝑝 𝑡 𝜃 ∗ 𝑝∗ ，自動的に詳細釣り合い条件が成立する！ 𝑃 𝜃 ∗ 𝑝∗ 𝜃 𝑡 𝑝 𝑡 𝑃 𝜃 𝑡 𝑝 𝑡 𝑌 = 𝑃 𝜃 𝑡 𝑝 𝑡 𝜃 ∗ 𝑝∗ 𝑃 𝜃 ∗ 𝑝∗ 𝑌 理論上は採択率１でいけ！実際にはリプフロッグ法（わかに１になませ 07 マルコフ連鎖モンテカルロ法(2) ）にな誤差がので 73

74.

HMCの流れ ① とえ位置𝜃 𝑡 にい ② 正規分布から 𝑝 𝑡 を発させ ③ リプフロッグ法にって𝐿時 ④ 得られた ⑤ （すをそれぞれンプリング候補 𝜃 ∗ 𝑝∗ とす応）率min ⑥ 採択すの位置𝜃 𝐿 ，運動 𝑝 𝐿 を 𝑃 𝜃 ∗ 𝑝∗ 𝑌 𝑡 𝑡 𝑃 𝜃 𝑝 𝑌 で採択す合は𝜃 𝑡+1 = 𝜃 ∗ ，採択しない前ペ基本の説明にってにはほぼ1になますが合は𝜃 𝑡+1 = 𝜃 𝑡 にす 07 マルコフ連鎖モンテカルロ法(2) 74

75.

HMCのチュニング ▌割と事な要素 𝜀｜１ステップの計算で何秒進むか【開始時】 𝜃 p. 72の式 𝜀 =𝜃 𝑝 𝜀 =𝑝 𝑝 𝜏 【細かい時 𝜀で切って更新してい + 𝜀𝑝 + 𝜀ℎ′ 𝜃 𝜀 す】 𝜃 𝜏+ 𝑝 𝜏+ 𝜀 =𝜃 𝜏− 𝜀 = 𝑝 𝜏𝜀 + 𝜀ℎ′ 𝜃 𝜀 + 𝜀𝑝 𝜏𝜀 𝜏+ 𝜀 𝜀が大きいほど，移動距離が伸びるが計算の 𝜃𝑡 当は一瞬一瞬変化するので一瞬ごとに計算していきたい 𝜃 𝜏 が低下する→採択率が下が 𝜀が小さいほど，計算のは上がるが移動距離が短なる →必要な 07 マルコフ連鎖モンテカルロ法(2) しが増え，自己相が高な 75

76.

HMCのチュニング更新の回 𝑝 𝜏 𝜀が小さい終はだとします合 𝜀が 𝑝 𝜏 きい合な位置終等高線上に近いが移動距離が短い 𝜃 𝜏 な位置距離は長いが等高線から離れてしまうことが実際には各ステップでの 07 マルコフ連鎖モンテカルロ法(2) 𝜃 𝜏 誤差は蓄積していと考えられます 76

77.

HMCのチュニング(2) ▌もう事なのはステップ 𝐿 ま，実際のンプリングが行われ時 𝑝 𝜏 𝐿が小さい終移動距離が長なほど， 𝜏 = 𝜀𝐿 合自己相 𝑝 𝜏 初の位置から離れが低な，ンプリング効率が上が 𝐿がきい合な位置終計算はすぐ終わるがあまり動けない 𝜃 𝜏 07 マルコフ連鎖モンテカルロ法(2) な位置 𝜃 𝜏 たさん動けるが計算は大変すぎと帰ってきゃう 77

78.

Stanの何がすごいって ▌この𝜀と𝐿を自動にいい感に決めてれ詳しは”No U-Turn S mp er NUTS ”で検索！にHMCをRで試してみたいといます【用意すもの】 • 事 • それを率 𝑃 𝜃𝑌 ∝𝐿 𝜃𝑌 𝑃 𝜃 ラメタごとに偏 − log 𝑃 𝜃 𝑌 = ℎ 𝜃 でリプフロッグ法でℎ′ 𝜃 𝜏 の log 𝑃 𝜃 𝑌 ∝ 𝐿𝐿 𝜃 𝑌 + log 𝑃 𝜃 分した面倒なので今回は「完全な無情報事前分布」として分布を設します分布は尤度の形に影響を与えないため尤度の偏が必要なため分さえ用意できれ OKとな 05 p. 55 資料正規分布モデルにおけ尤度の偏分は 07 マルコフ連鎖モンテカルロ法(2) 05 p. 55 78

https://www2.kobe-u.ac.jp/~bunji/files/lecture/bayes/bayes-05-poisson-normal.pdf#page=55.00

79.

[beta]

（補足）HMCのRコ ド

# HMC sampling
for(s in 2:S){

p_l <- p_0 <- rnorm(2,0,1) # パラメータが2 なので，運動量も2方向

▼準備・

ラメ タ設

theta_l <- theta_0 <- samples[s-1, ] # 時点lでのパラメータの位置 入れる箱
# leapfrog start

# データの読み込み

# 最初だけ1/2時点の移動なので調整

dat <- read.csv("data_cvs.csv")

theta_l <- theta_l - (epsilon/2)*p_l

SALES <- dat$sales

for(l in 1:L){

# 偏微

返す関数

theta_l <- theta_l + epsilon*p_l # muとsigma2の位置
# muの運動量

diff_mu <- function(Y,mu,sigma2){

p_l[1] <- p_l[1] + epsilon*diff_mu(SALES,theta_l$mu,theta_l$sigma2)

return((1/sigma2)*sum(Y-mu))
}

# sigma2の運動量

diff_sigma <- function(Y,mu,sigma2){

p_l[2] <- p_l[2] + epsilon*diff_sigma(SALES,theta_l$mu,theta_l$sigma2)
}

return((-length(Y)/(2*sigma2))+(1/(2*sigma2^2))*sum((Y-mu)^2))
}

# ループが終わった段階ではthetaがL-1/2時点にいるため，1/2時点 進める

# initial value

theta_l <- theta_l + (epsilon/2)* p_l

mu_init <- 5 # 1にするとハミルトニアンの計算がなぜか破綻する

# leapfrog finish

sigma2_init <- 1

# 提案された箇所のハミルトニアン

# repetition times

lp_prop <- sum(dnorm(SALES,theta_l$mu,sqrt(theta_l$sigma2),log=T)) - sum(1/2*p_l^2)

S <- 10000

# 動き始めた箇所のハミルトニアン

# HMCパラメータ

lp_old <- sum(dnorm(SALES,theta_0$mu,sqrt(theta_0$sigma2),log=T)) - sum(1/2*p_0^2)

epsilon <- 0.01

prob <- exp(lp_prop-lp_old)

L <- 15

if(runif(1) < prob){

# サンプリング結果 入れてお 箱(data.frame)

samples[s,] <- theta_l
} else {

samples <- data.frame(mu = rep(NA,S), sigma2 = NA)

samples[s,] <- theta_0

samples[1,c("mu","sigma2")] <- c(mu_init, sigma2_init)

本体

}

}

07 マルコフ連鎖モンテカルロ法(2)

79

80.

を見てみ plot(samples$mu,type="l") plot(samples$mu,samples$sigma2, type="l") 常っぽ見え常っぽ見え初初トレスプロットンプリングの動きどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 80

81.

初をすてて事分布 HMCに事分布 plot(density(samples$mu[-(1:200)])) 05 p. 95 共役事前分布から導事分布からのしたどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 81

82.

初をすてて事分布 HMCに事分布 plot(density(samples$sigma[-(1:200)])) 05 p. 95 共役事前分布から導事分布からのしたどうらうま行っています 07 マルコフ連鎖モンテカルロ法(2) 82

83.

チュニングの重要性 𝜀= 𝐿 = 5とすと ▌𝜀= 𝐿 = 5 とするとが吹っ飛ぶ戻ってこないかも標本平均・SDはここ素早常分布に到着 𝜀= 𝐿 = とすると stanの内部では，この 𝜀 と 𝐿 を自動にチュニングしてれ 07 マルコフ連鎖モンテカルロ法(2) おそすぎンプリング回が必要 83

84.

まとめと次回予告【まとめ】 ▌マルコフ連鎖モンテカルロ法の仕組みが分かましたか？ M-H法はにどんな確率からもサンプリング可能 HMCは「まるでボール転がすよに」サンプリングしているそんな難しいことが理解できなても使えるstanはありがたい【次回予告】 ▌MCMC (stan) を利用す際のプラクティカルな話をしますちゃんと「定常からのサンプリング」になっているかはどやって確認する？作成したコード・定結果もっと細か診断するには？ 07 マルコフ連鎖モンテカルロ法(2) …etc. 84

ベイズ統計_07_マルコフ連鎖モンテカルロ法(2)

Kyosuke Bunji

関連スライド

ベイズ統計_02_確率の基本とベイズの定理

ベイズ統計_01_イントロダクション

ベイズ統計_03_尤度

ベイズ統計_05_基本的なベイズ推論(2)

ベイズ統計_04_事前分布・基本的なベイズ推論(1)

ベイズ統計_06_マルコフ連鎖モンテカルロ法(1)

各ページのテキスト