【Diffusion勉強会】Generator Matching: Generative modeling with arbitrary Markov processes

4.2K Views

December 11, 24

スライド概要

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

Generator Matching: Generative modeling with arbitrary Markov processes Miyake Daiki, Matsuo Lab, M1 1

2.

書誌情報 • 著者 Peter Holderrieth, Marton Havasi, Jason Yim, Neta Shaul, Itai Gat, Tommi, Jaakkola, Brian Karrer, Ricky T.Q. Chen, Yaron Lipman 著者らはMetaの所属 (太字はFlow Matching論文の著者) • ICLR2025に投稿中 2

3.

概要 • Flow Matchingや離散Diffusion Modelを含む,より一般的なマルコフ過程を生成 するための生成モデルであるGenerator Matchingを提案した 3

4.

確率パス • (周辺)確率パス を考える • 両端の時刻で次の条件を満たす • 周辺確率パスの計算は難しいので,データ で条件付けられた条件付き確率パス を考える – この確率パスは で のみ確率を持つ • 条件付き確率パスは次を満たす 4

5.

条件付き確率パス • 条件付き確率パスはmixtureとgeometric averageの2通りが考えられる ノイズ データ 5

6.

マルコフ過程 • マルコフ過程 は次を満たす (未来は今にのみ依存する,過去には依存しない) • マルコフ過程の遷移カーネルを とする • マルコフ過程と初期分布&遷移カーネルは一対一対応する 6

7.

Generator • Generatorの概念の導入 • 以下のような を考えたい (遷移カーネルが微分可能とは限らないので,厳密ではない) 7

8.

Generator • 関数 に対して以下のactionという作用素を定義する • これによって厳密に を定義できる • いくつか仮定をおくとGenerator とマルコフ過程は一対一対応する 8

9.

Generator • Generatorは一般に以下の形式をとることが示せる • 一項目から順に,flow matching, diffusion model, 離散分布のGeneratorの形に対 応する 9

10.

Kolomogorov forward equation • 周辺確率パス とGenerator (KFE)というものが成り立つ との間に,Kolomogorov forward equation • Flow matchingの場合には連続の式,Diffusion modelの場合にはFokker-Planck 方程式に対応する 10

11.

条件付きGenerator • 条件付き確率パスを考えたのと同様に,条件付きGenerator • 条件付きGenerator と条件付き確率パス を考える はKFEを満たす 11

12.

条件付きGenerator • ある条件付き確率パスが与えられたとき,それに対応する条件付きGeneratorは1 つではない • 例えば, とすると, 付きGeneratorはKFEを満たす (Flow matching) • 一方で,以下の 満たす とした条件 という遷移行列を使った条件付きGeneratorもKFEを 12

13.

条件付きGenerator 両方使う サンプルの軌跡は異なる 周辺確率パスは一致 13

14.

パラメタライズ • は,作用素 • この ,内積 を使って以下のように表せる をニューラルネットで学習させる 14

15.

学習 • 学習時には,Bregman divergenceを最小化することを考える – は凸関数 • Bregman divergenceはKL divergenceやMSEを含む • 実際には も計算できないので,条件付けした を考える 15

17.

Markov superposition • ここまでの定式化は,Diffusion modelやFlow matchingとほぼ同じ • Generatorとして一般化したことで嬉しいのは,複数のGeneratorを混ぜて学習で きること (Markov superposition) • 各モデルで各Generatorを学習させる ロスは和をとる 17

18.

実験 • CIFAR-10とImageNetでの結果 • Jump + Flowが単純なFlow model (flow matching)よりも性能良 18

19.

まとめ • Flow matchingやDiffusion modelを一般化したGenerator Matchingを提案 • 複数のモデルを同時に学習させることで,性能上昇 19