24.4K Views
September 08, 22
スライド概要
第31回日本疫学会学術総会プレセミナー @online|2021年1月27日
Assoc prof at Tokyo University of Science. PhD in health sciences/MPH at the University of Tokyo. Causal inference in epidemiology/biostatistics.
第31回 日本疫学会学術総会プレセミナー 因果媒介分析を極める! 直接効果・間接効果の推定 時間依存性交絡がある場合 東京理科大学 工学部情報工学科 篠崎 智大 [email protected] 2021年1月27日 17:00~17:50 @Online
自己紹介 篠崎 智大(36歳) 学歴 東京理科大学報 2021年1月号 福井県立藤島高校 卒業 東京大学 医学部 健康科学・看護学科(現・健康総合科学科) 卒業 同 大学院医学系研究科 公共健康医学専攻 修了 同 健康科学・看護学専攻 博士後期課程 中途退学 SCT 2018 @Portland, OR にて 職歴 2012~ 東京大学 大学院医学系研究科 生物統計学分野 助教 2019~ 東京理科大学 工学部情報工学科 講師 本演題発表に関連し開示すべきCOI関係にある 企業・団体等はありません 2
アウトライン 前半の復習 A と M との時間的順序をはっきりさせよう その結果として現れる時間依存性交絡 L による厄介なバイアス 時間依存性交絡 L によって狭められる推測の射程 狭められた先に見える異なる因果モデルどうしの相克 因果媒介分析の新しい方向 因果媒介分析を行うためのハウツーではなく 現代の疫学誌上で何を前提として議論されているかをお伝えします 3
直接効果と間接効果 総合効果 治療後の全ての変化を通した効果 例:ランダム化比較試験のintent-to-treat解析 間接効果 ある機序を介して発現する効果 直接効果 それ以外のあらゆる機序で発現する効果 Indirect Effect Statin Cholesterol level Direct Effect CHD 4
MEGA Study Management of Elevated Cholesterol in the Primary Prevention Group of Adult Japanese プラバスタチンによる冠動脈イベント CHD(coronary heart disease)予防効果の 検証を目的とした一次予防試験 対象 CHD既往歴がなく総コレステロール値 220~270 mg/dL の中等度高脂血症患者 試験デザイン オープンラベル・ランダム化試験 食事療法単独群 3966名 追跡5年間 ランダム化 食事療法 + プラバスタチン併用群 3866名 CHD 脳卒中 発症を比較 Nakamura et al. Lancet 2006 “Primary prevention of cardiovascular disease with pravastatin in Japan (MEGA Study): a prospective randomised controlled trial” 5
CHD発症に対する試験結果(ITT解析) Hazard ratio (95% CI) = 0.70 (0.50-0.97) Log-rank P = 0.03 6
プラバスタチンの作用機序(1) コレステロール低下作用 HMG-CoA還元酵素を阻害 主に肝臓に分布、コレステロール合成を抑制 LDL (悪玉)コレステロール減少 HDL (善玉)コレステロール増加 総コレステロール値低下により血管内プラーク(肥厚)安定 7
プラバスタチンの作用機序(2) Statin’s “pleiotropic” effects 脂質低下以外の「多面的な」作用 抗炎症反応 内皮機能改善 プラーク退縮 抗血栓作用 … いずれも動脈硬化性疾患(e.g., CHD)のリスク要因を改善 8
CHD抑制に想定する作用機序 コレステロール低下を介する間接効果 作用機序(1) コレステロール低下を介さない直接効果 作用機序(2) Indirect Effect pravastatin cholesterol level CHD Direct Effect 因果媒介分析の出番 コレステロールが下がっていたからと言って間接効果が大きいとは言えない 9
潜在アウトカムで定義 Y a: 治療 A = a の潜在アウトカム (Y0, Y1) のうち、観測されるのはどちらか一方 他方は反事実 総合効果 E(Y1) – E(Y0) E(Y|A = 1) – E(Y|A = 0) とは一般に異なる C で層別した解析が必要 ☞ 前半の講義、ICRweb https://www.icrweb.jp/ C A Y 10
潜在アウトカムを拡張 Y a,m: 治療 A = a、中間変数 M = m の潜在アウトカム (Y0,0, Y1,0, Y0,1, Y1,1) のうち、観測されるのは1つ 残りは反事実 総合効果 1 0 E(Y1) – E(Y0) = E(Y1,M ) – E(Y0,M ) Ma:治療 A = a の潜在中間変数 C A M Y 11
2つの直接効果 制御された直接効果 E(Y1,m) – E(Y0,m) C と M で層別して推定 自然な直接効果 0 0 E(Y1,M ) – E(Y0,M ) 1 0 自然な間接効果 E(Y1,M ) – E(Y1,M ) と合計すると総合効果に C と M で層別した mediational formula / IPW IPW: inverse probability weighting C A M Y Petersen, et al. Epidemiology 2006 “Estimation of direct causal effects” VanderWeele. Epidemiology 2009 “Marginal structural models for the estimation of direct and indirect effects” 12
手法が効果を決めるのではない 因果構造が正しくないと… M を「調整」した自然な直接効果の推定値 左:そのとおりに解釈できる 右:総合効果 自然な間接効果の推定値 左:そのとおりに解釈できる 右:??? A M Y A M Y Keil, et al. AJE 2018 “Resolving an apparent paradox in doubly robust estimators” 13
A と M の時間順序が重要 A と M が同時に測定されているデータよりも… A と M の間の時系列がはっきりしているデータが望ましい 注:単なる測定タイミングの時間順序は必要条件でも十分条件でもない たとえば、変動しにくい変数(体格など)を中間変数とすると因果の逆転 順序性に蓋然性を与えられるデータ例 同一対象者を繰り返し測定したパネルデータ 来院スケジュールを厳格に定めた臨床試験データ 数年~数十年スパンで測定値をもつライフコースデータ … 14
例:高齢者におけるChildhood SES 幼少期の社会経済状況(SES)と死亡率・心血管疾患と関連 欧米、中高年で示されてきた 日本の高齢者では… 低SESの予後リスクは、高齢者で低めに出るという報告 Selective effect? 太平洋戦争を経験した世代 カロリー制限が与える良い影響? Child-SES ? 高齢時の死亡 Tani, et al. IJE 2016 “Childhood socioeconomic disadvantage is associated with lower mortality in older Japanese men: the JAGES cohort study” 15
Childhood SES(SESC)の死亡に対する効果は Adulthood SES(SESA)を介するか? Unmeasured risk factors Risk factors Confounder SESC SESA Mortality in later life Selection 16
JAGES : 2010調査票 + 2010–2013死亡データ アウトカム: Y 2010年から2013年の死亡 少年・少女期SES:A 「あなたが15歳当時の生活程度は、世間一般からみて、次のどれに入ると思いますか。」 1. 上 2. 中の上 3. 中 4. 中の下 5. 下 成人後SES: M 等価所得(世帯収入と世帯人数より):M1 1. ~199万 住宅:M2 1. 持ち家 職種:M3 2. 200万~400万 2. その他 1. 専門職・管理職 3. 400万~ 4. 欠測 3. 欠測 2. その他 3. 未就業 4. 欠測 17
A と M に時間的隔たりをもたせると 治療 A をランダム化できていても… 中間変数 M に対する時間依存性交絡 L が一般に存在 時間依存性交絡 : 治療後の交絡変数 しかも、治療の影響を受ける可能性 A M Y L U 18
治療の影響を受ける時間依存性交絡のジレンマ L を放置 ➡ M の効果求まらない ➡ E(Y a,m) も求まらない L2 を調整(層別) M←L→Y A → L → Y をブロック A→ L ← U → Y ➡ A の直接効果求まらない ➡ E(Y A M a,m) も求まらない Y L U 19
時間依存性交絡の調整が必要 これはできます g-methods g-公式 g-formula Robins & Greenland, Epidemiology 1992 “Identifiability and exchangeability for direct and indirect effects” Robins, Stat Med 1989 “The control of confounding by intermediate variables” VanderWeele, Epidemiology 2009 "Marginal structural models for the estimation of direct and indirect effects” Vansteelandt, Epidemiology 2009 “Estimating direct effects in cohort and case–control studies” 直接効果周辺構造モデルの逆確率重み付け推定 IPW estimation of direct-effect marginal structural models 直接効果構造ネストモデルの g-推定法 g-estimation of direct-effect structural nested models ただし、いずれも制御された直接効果のみ E(Y1,m) – E(Y0,m) 20
直接効果周辺構造モデル Direct-effect marginal structural models E(Ya,m) = P(Ya,m = 1) をモデル化 リスク差モデル: P(Ya,m = 1) = β0 + β1a + β2m + β3am β 1: m = 0 での直接効果(リスク差) β1 + β3 : m = 1 での直接効果(リスク差) 対数リスク比モデル: log P(Ya,m = 1) = β0 + β1a + β2m + β3am β 1: m = 0 での直接効果(対数リスク比) β1 + β3 : m = 1 での直接効果(対数リスク比) VanderWeele. Epidemiology 2009 “Marginal structural models for the estimation of direct and indirect effects” 21
直接効果周辺構造モデルのIPW推定 1. 構造モデルの特定 log P(Ya,m = 1) = β0 + β1a + β2m + β3am A 2. 曝露 A に対する重みを推定 SWiA 3. 曝露割合 P(A = ai|C = ci) ロジスティック回帰から 中間変数 M に対する重みを推定 SWiM 4. = P(A = ai) = P(M = mi|A = ai) P(M = mi|C = ci, A = ai, L = li) ロジスティック回帰から SWA * SWM を重みとして関連モデルを当てはめ log P(Y = 1|A = a, M = m) = γ0 + γ1a + γ2m + γ3am A と M のみ調整 22
IPWの応用例 23
制御された直接効果の識別可能条件 1. 2. E(Y a,m) が求まればよい 治療 X の非交絡 a,m ∐ A |C for all (a, m) Y 中間変数の非交絡 a,m ∐ M |C, A = a, L for all (a, m) Y A M Y L U Shinozaki & Suzuki, JE 2020 “Understanding marginal structural models for time-varying exposures: pitfalls and tips” 24
データが複雑になっても MEGA Studyデータ コレステロール値 M に依存して治療法 A が変更 割り付け群に依らず、患者状態に応じて医師の裁量でプラバスタチン投与・休薬を決定 治療法 A に依存して途中のコレステロール値 M が変化 A と M の交絡変数 L(体重など生活習慣因子)も影響を受けつつ変化 U L1 L2 M2 M1 A0 A1 A2 Y C は図から省略 Shinozaki et al. Stat Med 2014 “Estimation of controlled direct effects in time-varying treatments using structural nested mean models…” 25
直接効果構造ネストモデルのg-推定値 IPWやg-公式を用いて推定することも可能 References in: Shinozaki et al. Stat Med 2014 “Estimation of controlled direct effects in time-varying treatments using structural nested mean models…” 26
アウトライン(再) 前半の復習 A と M との時間的順序をはっきりさせよう その結果として現れる時間依存性交絡 L による厄介なバイアス 時間依存性交絡 L によって狭められる推測の射程 狭められた先に見える異なる因果モデルどうしの相克 因果媒介分析の新しい方向 27
時間依存性交絡の調整が必要(再) これはできます g-methods g-公式 g-formula 直接効果周辺構造モデルの逆確率重み付け推定 IPW estimation of direct-effect marginal structural models 直接効果構造ネストモデルの g-推定法 g-estimation of direct-effect structural nested models ただし、いずれも制御された直接効果のみ E(Y1,m) – E(Y0,m) 28
間接効果? 一般に… 総合効果 – 直接効果 ≠ 間接効果 総合効果 : E(Ya=1 – Ya=0) 直接効果 : E(Ya=1,m – Ya=0,m) 治療 A と中間変数 M に交互作用がある場合 29
「自然な」直接効果 “natural” direct effects E(Y1,M 0 )– E(Y0,M 0 ) M0:治療 X = 0 に対応する潜在中間変数 x x,M E(Y ) = E(Yx) “pure” natural direct effect ということも 1 1 1,M 0,M “total” natural direct effect = E(Y ) – E(Y ) 30
「自然な」間接効果 “natural” indirect effects “total” natural direct effect ということも E(Y1,M 1 )– E(Y1,M 0 ) natural DE + natural IE = total effect 0 0 1 0 1,M 0,M 1,M 1,M E(Y ) – E(Y ) + E(Y ) – E(Y ) 1 0 1,M 0,M = E(Y ) – E(Y ) データから求めることの難しさ 0 Y1,M :必ず反事実 時間依存性交絡が治療の影響を受けると一般に識別不能 31
Natural DE/IE の識別可能条件 1. 2. 3. 4. 治療 X の Y への効果の非交絡 a,m ∐ A |C for all (a, m) Y 中間変数 M の Y への効果の非交絡 a,m ∐ M |C, A = a, L for all (a, m) Y 治療 X の M への効果の非交絡 a M ∐ A |C for all a cross-world independence of∗ the mediator M and the outcome Y a,m a ∐ M |C for all (a, a*, m) Y 32
因果DAG causal directed acyclic graphs A → L がない場合 条件1–4が成立 ➡ natural effects を識別可能 A → L がある場合 条件1–3は成立するが条件4が一般に不成立 ➡ natural effects を識別できない controlled effects なら識別可能 黒木. 2017 『構造的因果モデルの基礎』 A M Y L U 33
A → L がなくても Robinsの因果モデルで識別可能な直接効果は制御された直接効果のみ M = m に制御 �k = m � k に制御 M Pearlの構造方程式モデルで識別可能な直接効果 a=0 Pure (natural) direct effect = PDE(1,0) = E(Y a=1,M ) Principal stratum direct effect = PSDE = E(Ya=1 – Ya=0|Ma=1 = Ma=0) “cross-world” intervention で定義される効果 因果の実在論 ontology に関する議論 34
2つの因果モデル Judea Pearl Don Rubin V1 V2 V3 V4 V5 https://twitter.com/yudapearl Yi(1) Control X=0 Yi(0) https://statistics.fas.harvard.ed u/people/donald-b-rubin Rubinの因果モデル(RCM) 構造的因果モデル 構造方程式 Vk = f(paVk, εk) Treatment X=1 モデルの基礎要素 潜在(反事実)アウトカム Yi(1) vs. Yi(0) グラフ(DAG, directed acyclic graph) 推測の基礎理論 割付メカニズム、標本分布論、欠測データ マルコフ条件、定常性、自律性 キーとなる仮定 SUTVA (consistency + no-interference) “Causation before manipulation” 因果に関する標語 “No causation without manipulation” 35
第3の因果モデル Judea Pearl Don Rubin V1 V2 V3 V4 V5 https://twitter.com/yudapearl Treatment X=1 Yi(1) Control X=0 Yi(0) https://statistics.fas.harvard.ed u/people/donald-b-rubin James Robins https://www.hsph.harvard.edu/epimethods/epi-methods-faculty/ 36
Robinsの因果モデル FRCISTG(fully randomized causally interpretable structured tree graph) Rubin的 モデルの基礎要素(ontological primacy)として潜在アウトカム Yi(x) を措定 SUTVA(consistency + no-interference)を満たす介入に限って効果を定義 Pearl的 グラフ(DAG)に基づく識別条件の整理 ただし、グラフの解釈は Pearl と異なる(⇒ SWIG の導入) 複雑な関係にある複数変数への逐次的な介入を許容 Robins & Richardson, 2010 “Alternative graphical causal models and the identification of direct effect” 37
Robinsの因果モデル FRCISTG(fully randomized causally interpretable structured tree graph) Rubin的 モデルの基礎要素(ontological primacy)として潜在アウトカム Yi(x) を措定 SUTVA(consistency + no-interference)を満たす介入に限って効果を定義 Pearl的 グラフ(DAG)に基づく識別条件の整理 ただし、グラフの解釈は Pearl と異なる(⇒ SWIG の導入) 複雑な関係にある複数変数への逐次的な介入を許容 介入主義 interventionism 「現実に可能な介入」で定義される効果のみ推測対象とする 定義される効果:Rubinモデル(介入の種類を限ればPearlとも)と同様 識別される効果:PearlよりもRubinよりも限定される 38
逐次的交換可能の仮定 RobinsのFRCISTG Yi gA=a� の実在を仮定 �k � k–1 = a� k–1, C Y gA=a� ∐ Ak gA=a� k–1 | A for all a� Progression of disease Follow-up status before 2nd-line treatment Metastasis/recurrence None 2nd-line treatment None 2nd-line treatment None 2nd-line treatment Pearlの構造的因果モデル � i, εYi) の実在を仮定 ⇒ Yi gA=a� 構造方程式 Yi = f(a� , C � k for all a� , a� *, a� ** � k–1 = a� k–1, C Y gA=a� ** ∐ Ak gA=a� ∗k–1 | A 39
アウトライン(再) 前半の復習 A と M との時間的順序をはっきりさせよう その結果として現れる時間依存性交絡 L による厄介なバイアス 時間依存性交絡 L によって狭められる推測の射程 狭められた先に見える異なる因果モデルどうしの相克 因果媒介分析の新しい方向 40
A → L がある場合の効果の分解 1. いくつかの提案 (L, M) をまとめて1つの中間変数とみなす • 2. 3. 4. でも U があると、その交絡を防ぐための変数が必要で…という無限遡行 パスごとの効果 path-specific effects 新しい直接・間接効果の定義 interventional direct/indirect effects 仮定の追加 Taguri & Chiba, Stat Med 2015 A M Y L U VanderWeele, Vansteelandt & Robins. Epidemiology 2014 “Effect decomposition in the presence of an exposure-induced mediator-outcome confounder” 41
Interventional direct/indirect effects (謎の)確率変数 Ga|c A = a という介入下での M の反事実分布 P(Ma = m|C = c) から ベースライン交絡変数の値 Ci に応じて対象者 i ごとにランダムサンプル この「ランダムに選ばれた値」に中間変数を固定 0|C E(Y1,G 0|C E(Y0,G 直接効果 IDE = )– ) 1|C 0|C 1,G 1,G 間接効果 IIE = E(Y ) – E(Y ) …なんですかねこれは? 42
ふたつの世界線 M1 1 Y1,M 総合効果 E(Y1) – E(Y0) M0 0 Y0,M 山室他, 2019年 統計関連学会連合大会より 43
ふたつの世界線(C = c のサブグループ) G M1 1|c 1 Y1,M G M0 0|c 0 Y0,M 山室他, 2019年 統計関連学会連合大会より 44
みっつの世界線(C = c のサブグループ) G M1 1|c 1 0|c 1,G Y Y1,M G M0 0|c 0 Y0,M 山室他, 2019年 統計関連学会連合大会より 45
いつつの世界線(C = c のサブグループ) G M1 1|c 1 Y1,M 1|c Y1,G G M0 0 Y0,M 0|c 1,G Y 0|c 0|c 0,G Y 山室他, 2019年 統計関連学会連合大会より 46
いつつの世界線(C = c のサブグループ) G M1 間接効果 IIE 1|c 1 Y1,M 1|c Y1,G G 0|c 1,G Y 0|c 直接効果 IDE M0 0 Y0,M 0|c 0,G Y 山室他, 2019年 統計関連学会連合大会より 47
いつつの世界線(C = c のサブグループ) G M1 1|c 1 Y1,M 1|c Y1,G G M0 0 Y0,M 0|c 1,G Y 0|c overall effect = IIE + IDE 0|c 0,G Y 山室他, 2019年 統計関連学会連合大会より 48
Overall effect OE = 1|C E(Y1,G )– 0|C E(Y0,G ) 一般に overall effect ≠ total effect = E(Y1) – E(Y0) A の影響を受ける時間依存性交絡 L があるとき ただし、近い値を取るのであれば効果の分解ができたとみなす でも、効果の分解を第一義に考えるなら path-specific effectsがよいのかも Vansteelandt, 私信 49
Interventional effects の識別可能条件 1. 2. 3. 治療 X の Y への効果の非交絡 a,m ∐ A |C for all (a, m) Y 中間変数 M の Y への効果の非交絡 a,m ∐ M |C, A = a, L for all (a, m) Y 治療 X の M への効果の非交絡 a M ∐ A |C for all a 50
推定方法は natural effects と同じ公式 Mediational formula a*|C E(Y a,G )= � � � E(Y|a, l, m, c) P(m|a∗ , l, c) P(l|a, c) P(c) c l m Robinsの介入主義因果モデルでも許容される効果 なので interventional effects 51
2方向への拡張も 繰り返し治療/中間変数の繰り返し測定 A と M の時間依存性交絡はそれより前のA と M に影響を受けると考えられる natural effects は識別不可だが interventional effects は可 VanderWeele & Tchetgen Tchetgen, JRSSB 2017 Lin et al., Stat Med 2017; Epidemiology 2017 複数の中間変数 中間変数 M1, M2 どうしに関連があると、一方が他方の交絡変数として働く しかも中間変数である以上、治療の影響を受けると想定 natural effects は識別不可だが interventional effects は可 Vansteelandt & Daniel, Epidemiology 2017 52
まとめ 因果媒介分析の(少なくともここ3~4年くらいの)議論まで紹介 どんなデータに対しても媒介分析ができるわけではない データが十分測定されていたとしても好きな効果が求まるわけではない 未測定の交絡変数など、データ測定が足りていないこととは違う データに仮定する因果構造自体が推測の妨げになることがある というジレンマの中で議論が続いているのが現代の因果媒介分析です 特に… Interventional effects 仮定に合わせてデータから求まる効果が理論的に導かれた例 Moving the goalpost? or More meaningful causal decomposition? 53