1.2K Views
October 31, 25
スライド概要
標的試験エミュレーション(target trial emulation):観察研究における因果推論を強化するためのフレームワーク
2025年10月3日
https://doi.org/10.3820/jjpe.30.e3
https://doi.org/10.3820/jjpe.30.e4
京都大学大学院医学研究科社会健康医学系専攻薬剤疫学分野 特定講師
2025年10月3日 標的試験エミュレーション (target trial emulation) 観察研究における因果推論を強化するためのフレームワーク 深澤 俊貴 京都大学大学院医学研究科 社会健康医学系専攻 薬剤疫学分野 [email protected] 1
ランダム化比較試験 (RCT) が非現実的な状況と観察研究への期待 介入の有効性や安全性に関する因果的な問いに答えるには、適切に設計・実施されたRCTが理想 ○ しかし、倫理的配慮、高額な費用、運営上の障壁、あるいは長期追跡の必要性といった諸事情 から、RCTが非現実的な状況は少なくない RCTでは対応しきれない複雑な臨床疑問や、迅速な判断を要する公衆衛生上の課題に取り組むた めに、観察研究の重要性が高まっている ○ しかし、観察研究はランダム化の欠如による交絡に加え、不適切な研究デザインがもたらす選 択バイアスや不死時間 (immortal time) など、効果推定を容易に歪めかねない脆弱性を内包 こうした課題に対処するための有効なフレームワークとして「標的試験エミュレーション (target trial emulation)」が近年注目を集めている 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 2
標的試験エミュレーション (target trial emulation) 観察研究における因果推論を強化するためのフレームワーク 関心のある因果的な問いに答えうる仮想のプラグマティックRCT (標的試験) のプロトコルを精緻に設計し、 それを利用可能な観察データを用いて明示的に模倣 (エミュレート) する形で研究を実施する2段階プロセス 標的試験エミュレーションあるいはそれと理論的に等価な概念は、20世紀半ばの統計学や計量経済学に起源 1986年にRobinsによって反事実理論が時間依存性治療 (time-varying treatments) に拡張される形で一般的 な定式化が行われ、2016年にHernánとRobinsによって観察研究のための体系的フレームワークとして提唱 Hernán MA, Robins JM. Am J Epidemiol. 2016;183(8):758-764. 3
標的試験エミュレーションの手順 Step 1:関心のある因果的な問いに答えうる仮想のプラグマティックRCT (標的試験)* のプロトコ ルの構成要素を特定する (point at the target) *実臨床に近い状況で治療の安全性や有効性を評価するための、制約が少なく柔軟なデザインのRCT 1. 適格基準 2. 治療戦略 3. 治療割り付け 4. アウトカム 因果的な推定対象 (causal estimands) 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 Step 2:利用可能な観察データを用いて明示的にエミュレートする形で研究を実施する (shoot the target) 4
標的試験 標的試験は「理想としてのRCT」であると同時に、「利用可能な観察データを用いて合理的にエ ミュレート可能な試験」 Step 1のプロトコル設計とStep 2のエミュレーションは相互に行き来する反復的なプロセスを経 て洗練されていき、「どこまで理想的なRCTに近づけるか」と「どこまで観察データに起因する 制約を許容するか」の間にある妥協点が明確化される このように構造化されたアプローチこそが標的試験エミュレーションの核心をなし、RCTが本来 備える望ましい特長である「因果的な問いを厳密に定義したうえで効果推定を行う枠組み」を観 察研究においても最大限維持するための方法論的基盤となる なお、観察データを前提とする以上、プラセボ対照や盲検化、現実には存在しない介入を設定す ることは不可能。患者のモニタリング頻度も、利用可能なデータの粒度に合わせる必要あり 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 5
標的試験フレームワーク (target trial framework) vs. PECO 標的試験フレームワークにおける「因果的な推定対象 (causal estimands)」を構成する6つの要素のうち、 PECOのカバー範囲はたったの3つだけ (適格基準、治療戦略、アウトカム) ○ そのうえ、PECOでRQを要約する研究において、適切なレベルで治療戦略を規定できている研究は稀 PECOのフレームワークを使うこと自体が、因果的な問いを曖昧にするため、因果推論研究で (他の多くの 研究でも) 使用すべきではない 標的試験フレームワークの最大の貢献は、因果的な問いに内在する曖昧さを大幅に解消し、観察研究を介し た効果推定の妥当性を高めること 1. 適格基準 2. 治療戦略 3. 治療割り付け 4. アウトカム 因果的な推定対象 (causal estimands) 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 6
標的試験エミュレーションの普及 Desai RJ, et al. BMJ. 2024;384:e076460. Cashin AG, et al. JAMA. 2025. DOI: 10.1001/jama.2025.13350 7
標的試験エミュレーションの日本語解説 日本薬剤疫学会の編集委員として、企画「標的試験エミュレーション:観察研究における因果推論の新たな パラダイム」を立案 (企画趣旨:10.3820/jjpe.30.e3) 標的試験エミュレーションの理論と実践を解説 第1弾:標的試験エミュレーション:観察研究における因果推論を強化するためのフレームワーク (DOI: 10.3820/jjpe.30.e4) 第2弾:標的試験エミュレーションによる不死時間への対処:逐次試験エミュレーションとClone-CensorWeightアプローチ (2026年1月掲載予定) 8
標的試験エミュレーションの適用事例:デノスマブ研究 骨粗鬆症を併存する維持透析患者を対象に、デノスマブと経口ビスホスホネート製剤の心血管安全性および 骨折予防効果を比較した観察研究 DeSCヘルスケア株式会社が提供するレセプトデータを使用し、2014年4月1日–2022年10月31日までのデー タが解析対象 ○ 組合管掌健康保険、国民健康保険、後期高齢者医療制度の保険者からデータを取得 Masuda S et al. Ann Intern Med. 2025;178(2):167-176. 9
Annals of Internal Medicine 掲載までの道のり タイムライン ステータス タイムライン ステータス 2024/06/18 Submit 2024/10/28 Re-submit 2024/07/26 Revision 1 2024/11/04 Revision 3 2024/08/22 Re-submit 2024/11/08 Re-submit 2024/09/04 Revision 2 2024/11/12 Revision 4 2024/09/13 Re-submit 2024/11/15 Re-submit 2024/10/04 Reject 2024/11/15 Accept 2024/10/05–2024/10/16 Editorとのやり取り 2025/01/07 Publish Annals of Internal Medicine は、世界最大の内科専門医の学会である米国内科学会の機関誌であり、内科系 トップジャーナルの1つ 本論文のMethods EditorはMiguel Hernán教授 (target trial emulationの提唱者) であり、教育的なコメント が多く、このジャーナルにかける熱意が感じられた 一度リジェクトされ落ち込んだが、最終的な論文は初回投稿時の原稿からブラッシュアップされ、一連の査 読プロセスを経て、研究者としてさらなる高みへと引き上げられたように感じるため、とても感謝している 10
デノスマブ研究の社会的インパクト 11
デノスマブ研究の背景 大学院生であった医師12年目の桝田崇一郎先生 (整形外科医) が立案 骨粗鬆症治療の第一選択薬はビスホスホネートだが、腎排泄のためCKD患者に使いにくい ○ ただし、透析患者は腎機能が廃絶しているので関係ない? デノスマブは数ある骨粗鬆症治療薬のなかで、腎機能に関わらず使用できる貴重な薬剤 ○ 一方、低Ca血症のモニタリングが重要であり、心血管イベントへの影響についても十分なエビデンスが 確立されていない 透析患者を対象としたRCTは存在せず、システマティックレビューでも明確な推奨なし 透析患者において、デノスマブと経口ビスホスホネートによる重度の低Ca血症のリスクを比較した論文が 2024年にJAMA から出ており、世界的にもトピック? (12週間累積発生率:デノスマブ群 41.1% vs. 経口ビスホスホネート群 2.0%) Bird ST et al. JAMA. 2024;331(6):491-499. 日本は他国と比較して透析患者が多いため、症例が集まりやすい? 透析患者は心血管イベントの発生頻度も 高そう 12
日本のレセプトデータベース 主な公的DB NDB 網羅性 * 追跡性 ◎ 主な民間DB KDB JMDC 保険者DB JMDC 後期高齢者DB DeSC DB △ △ △ 〇 組合健保、共済、 国保 後期高齢者 組合健保、国保、 後期高齢者 ほぼ全国民 (組合健保、 国保、後期高齢者 協会けんぽ、共済、 国保、後期高齢者) ◎ 転院しても可 検査値 取得 △ 健診データから 限定的に可 *保険ごとに対象者が異なるため、DBごとにカバーする対象者の年齢、性別、職種に偏りがある 13
研究デザインの分類 14
標的試験のプロトコルの構成要素 1. 適格基準 2. 治療戦略 3. 治療割り付け 因果的な推定対象 (causal estimands) 4. アウトカム 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 15
デノスマブ研究の適格基準 標的試験の特定 標的試験のエミュレーション 選択基準: 選択基準: (1) 2015年4月1日–2021年10月31日の間に、日本国内 (1)–(2) 標的試験と同じ で骨粗鬆症と診断された50歳以上の患者 (2) 90日以上の維持透析歴 除外基準: (1) 追跡開始以前に悪性腫瘍、骨巨細胞腫、または骨 パジェット病の既往 (2) 追跡開始以前に腎移植の既往 (3) 追跡開始の前日までにデノスマブまたは経口・静 注ビスホスホネート製剤の使用歴 (4) 追跡開始日にデノスマブと経口ビスホスホネート 製剤の使用 (5) 追跡開始以前の90日間に急性心筋梗塞、脳卒中、 または心不全で入院 除外基準: (1)–(3) 標的試験と同じ (データベース内で遡及 可能な限りの期間において判定) (4)–(5) 標的試験と同じ (6) 追跡開始以前のデータベースへの登録期間が365日 未満の患者 16
適格基準のエミュレーション 適格基準のエミュレーションは、標的試験プロトコルの選択・除外基準を観察データに適用する プロセス 各種基準を十分な精度で反映できる観察データを、その構造的特性、収集方法、および限界につ いて深く理解したうえで選択する ○ 「仮に標的試験を実施した場合に生成されうるデータ」と「手元の観察データ」がどれだけ近 似しているか? Step 1のプロトコル設計とStep 2のエミュレーションを反復し、「どこまで理想的なRCTに近づ けるか」と「どこまで観察データに起因する制約を許容するか」の間にある妥協点を明確化 適格基準の適切な設計と適用は、エミュレーションの内的妥当性と外的妥当性の均衡を保持する 基盤 17
デノスマブ研究の適格基準 標的試験の特定 標的試験のエミュレーション 選択基準: 選択基準: (1) 2015年4月1日–2021年10月31日の間に、日本国内 (1)–(2) 標的試験と同じ で骨粗鬆症と診断された50歳以上の患者 (2) 90日以上の維持透析歴 RCTでは維持透析を容易に判定できるため「90日以上の維持透析歴」といった条件は不要だが、観察デー 除外基準: 除外基準: (1) タ 追跡開始以前に悪性腫瘍、骨巨細胞腫、または骨 (1)–(3) 標的試験と同じ (データベース内で遡及 (レセプトデータ) から維持透析を妥当に特定するには工夫がいる 可能な限りの期間において判定) ○パジェット病の既往あり 標的試験は「実際に実施したい理想的な試験」と「手元の観察データを使用して合理的に模倣できる試 (2) 追跡開始以前に腎移植の既往あり 験」との妥協点 (3) 追跡開始の前日までにデノスマブまたは経口・静 「90日以上の維持透析歴」は、診療報酬請求制度や臨床情報を踏まえて定義 注ビスホスホネート製剤の使用歴あり (4) ○追跡開始日にデノスマブと経口ビスホスホネート (4)–(5) 標的試験と同じ 透析の診療行為は「維持透析」または「急性透析 (急性腎障害や高カリウム血症などへの対応)」のいず 製剤の使用あり れかに対して算定 (5) 追跡開始以前の90日間に急性心筋梗塞、脳卒中、 ○または心不全で入院あり 維持透析は通常週3回行われるが、慢性腎臓病の急性増悪時には数回のみで終了する場合あり ○ 急性透析の誤分類を排するために、単なる透析回数ではなく、連続した月単位での算定確認が必要 (6) 追跡開始以前のデータベースへの登録期間が365日 未満の患者 18
デノスマブ研究の適格基準 標的試験の特定 標的試験のエミュレーション 選択基準: 選択基準: (1) 2015年4月1日–2021年10月31日の間に、日本国内 (1)–(2) 標的試験と同じ で骨粗鬆症と診断された50歳以上の患者 (2) 90日以上の維持透析歴あり 除外基準: 除外基準: (1) 追跡開始以前に悪性腫瘍、骨巨細胞腫、または骨 (1)–(3) 標的試験と同じ (データベース内で遡及 パジェット病の既往 可能な限りの期間において判定) (2) 追跡開始以前に腎移植の既往 (3) 追跡開始の前日までにデノスマブまたは経口・静 注ビスホスホネート製剤の使用歴 (4) 追跡開始日にデノスマブと経口ビスホスホネート (4)–(5) 標的試験と同じ RCTでは既往や薬剤使用歴を容易に把握できるが、観察データでは遡及可能な期間に限界あり。この制約に 製剤の使用あり (5) 追跡開始以前の90日間に急性心筋梗塞、脳卒中、 よる誤分類をどの程度許容できるか? または心不全で入院あり (6) 追跡開始以前のデータベースへの登録期間が365日 未満の患者 19
デノスマブ研究の適格基準 標的試験の特定 標的試験のエミュレーション 選択基準: 選択基準: (1) 2015年4月1日–2021年10月31日の間に、日本国内 (1)–(2) 標的試験と同じ で骨粗鬆症と診断された50歳以上の患者 (2) 90日以上の維持透析歴あり 除外基準: 除外基準: (1) 追跡開始以前に悪性腫瘍、骨巨細胞腫、または骨 (1)–(3) 標的試験と同じ (データベース内で遡及 パジェット病の既往あり 可能な限りの期間において判定) (2) 追跡開始以前に腎移植の既往あり (3) 追跡開始の前日までにデノスマブまたは経口・静 注ビスホスホネート製剤の使用歴あり (4) 追跡開始日にデノスマブと経口ビスホスホネート (4)–(5) 標的試験と同じ RCTでは、研究への適格性の判定時に既往歴や薬剤使用歴を容易に確認できるが、観察データではこれらを 製剤の使用あり (5) 追跡開始以前の90日間に急性心筋梗塞、脳卒中、 把握するためのベースライン期間 (追跡開始以前のデータベースへの登録期間) を明示的に設定する必要あり または心不全で入院あり (6) 追跡開始以前のデータベースへの登録期間が365日 未満の患者 20
標的集団、研究サンプル、解析サンプルの関係 標的集団 (target population):アウトカム分布を特徴付ける対象となる集団。意思決定単位 研究サンプル (study samples):研究対象となるサンプル 解析サンプル (analytical samples):解析対象となるサンプル (例:研究サンプルから、解析に 用いる変数のデータが欠測している者を除外した後に残ったサンプル) 外的妥当性 標的集団における 因果的な推定対象 内的妥当性 研究サンプルにおける 因果的な推定対象 解析サンプルにおける 因果的な推定対象 データの利用可能性、適格基準 データ欠測、追跡不能 (loss to follow-up) 一般化可能性 (generalizability)、 移送可能性 (transportability) データ欠測への対処、 inverse probability of censoring weighting 21
標的試験のプロトコルの構成要素 1. 適格基準 2. 治療戦略 3. 治療割り付け 因果的な推定対象 (causal estimands) 4. アウトカム 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 22
デノスマブ研究の治療戦略 標的試験の特定 標的試験のエミュレーション (1) デノスマブ60 mgの皮下投与の開始 (2) 経口ビスホスホネート製剤の開始 治療期間の決定は、臨床医の裁量に委ねる 標的試験と同じ 本研究では、時間固定治療 (time-fixed treatments) のみを扱った 時間依存性治療 (time-varying treatments) のエミュレーションは、治療戦略の静的・動的の別を問わず、 時間経過に伴う治療アドヒアランスの変動に対処しなければならないため、複雑 ランダム化後 (ベースライン後) の共変量が割り付け後の治療の影響を受ける場合、治療・交絡変数フィード バック (treatment-confounder feedback)* を調整するためにg-methodsが必要 *過去の治療が現在の交絡変数に影響を及ぼし、その交絡変数がさらに未来の治療選択にも影響するフィー ドバック (例:過去のビスホスホネートによる治療が現在の骨密度に影響を及ぼし、その骨密度がさらに未 来のビスホスホネートの継続・中止の判断に影響する) 治療アドヒアランスに関連する時間依存性交絡変数の詳細な情報が得られない場合、g-methodsを用いたと しても時間依存性治療を含む標的試験の妥当なエミュレーションは困難 23
治療戦略の種類 時間固定治療 (time-fixed treatments): 一時的介入 (point interventions) とも呼ばれる。単回のワクチン接種や外科的処置のように、研究期間内の 単一時点で実施される介入 → intention-to-treat効果 時間依存性治療 (time-varying treatments): 持続的治療戦略 (sustained treatment strategies) とも呼ばれる。薬剤の定期的服用のように、時間経過に 伴う複数回の連続的介入 → per-protocol効果 ○ 静的治療戦略 (static treatment strategies): - 治療開始後の個人の臨床経過に関わらず、対象集団全体に対して一律に適用される治療方針 (例:治療 継続、治療非実施、一定期間のみ治療実施など) - 「治療開始以降の副作用発現後も治療を継続する」といった非現実的な設定を含む ○ 動的治療戦略 (dynamic treatment strategies): - 治療開始後に時間とともに変化する個人の特性や臨床経過に応じて治療内容を変更する治療方針または ルールであり、臨床実践により即した設定 - 例えば、「副作用発現時には治療中止、それ以外は継続」という治療戦略では、副作用のために治療を 中止した個人は、この治療戦略からの逸脱とは見なされない 24
時間依存性治療のエミュレーション 時間依存性治療をエミュレートしてper-protocol効果を求めるには、不完全なアドヒアランスによる交絡に 対処する必要がある ○ Step 1:個人が治療戦略から逸脱した時点で追跡を打ち切る (ただし動的治療戦略では、副作用などの臨 床的理由で治療を中止した場合は逸脱と見なさず、追跡を打ち切らない) - 逸脱した時点での人工的な打ち切りはランダムではないので、選択バイアスが発生 ○ Step 2:アドヒアランスを予測するランダム化前 (ベースライン) とランダム化後 (ベースライン後) の共 変量を適切に調整し、選択バイアスに対処 - 例:inverse probability of censoring weighting (IPCW) による調整 25
時間依存性治療におけるアドヒアランス (開始、継続、中止) の操作的定義 1/2 治療の中止は、完全ではないアドヒアランス (飲み忘れによる残薬、患者の再診の遅れ) を考慮した猶予期間 (grace period) を用いて設定されることが多い 猶予期間は、薬剤の種類、服薬頻度、基礎疾患などの臨床的観点から設定される 前回の処方日数経過日から次の処方日までの期間であるギャップ (gap) が、規定の猶予期間を超える場合、 前回の処方日数に猶予期間を加算した時点を治療の中止とみなす 深澤 俊貴, 他. 薬剤疫学. 2023;28(2):39–55. 26
時間依存性治療におけるアドヒアランス (開始、継続、中止) の操作的定義 2/2 患者が前回の処方日数分の薬剤を使い終える前に新たに薬剤を処方されることにより発生する残薬 (stockpiling) への対処 → 対処しないと、治療継続期間が実際よりも短くなる (長期的に使用される薬剤では特に影響を受ける) → 2回以上連続で残薬が発生した場合、その残薬をどのように処理するかは、その薬剤の特徴をもとに決める ことがある 深澤 俊貴, 他. 薬剤疫学. 2023;28(2):39–55. 27
治療の効果持続期間・リスク期間 治療の効果持続期間・リスク期間の種類 キャリーオーバー期間 (carryover period):体内に残っている薬剤がアウトカムの発生に影響する期間。薬 剤の半減期から推測可能 誘導期間 (induction period):治療がアウトカムの発生に影響を与えるのに必要な期間 潜伏期間 (latent period):アウトカム発生から診断までの期間 誘導期間や潜伏期間への対処法 患者が治療を中止・終了しても、誘導期間・潜伏期間中は追跡を打ち切らず、観察し続ける 誘導期間・潜伏期間は、その長短が不確実であることが多いため、期間を変化させた感度解析が重要 誘導期間・潜伏期間が長いことが想定されるアウトカムの場合、治療開始直後に発生したアウトカムは、そ の治療に起因するとは考えにくい ○ 治療開始直後に発生したアウトカムをネガティブコントロールアウトカム (negative control outcomes) と見なした解析などが必要。群間差が発生するのであれば、未測定交絡によるバイアスの可能性 深澤 俊貴, 他. 薬剤疫学. 2023;28(2):39–55. 28
誘導期間中のアウトカムをネガティブコントロールアウトカムにした事例 BNT162b2ワクチン vs. mRNA-1273ワクチンのCOVID-19感染予防効果 米国退役軍人データベースを用いた観察研究 ワクチン接種後10日間における症候性のCOVID-19感染がネガティブコントロールアウトカム (RCTの結果か ら、この期間ではワクチン間の予防効果に差があることは期待されない) Dickerman BA, et al. N Engl J Med. 2022;386(2):105-115. 29
標的試験のプロトコルの構成要素 1. 適格基準 2. 治療戦略 3. 治療割り付け 因果的な推定対象 (causal estimands) 4. アウトカム 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 30
デノスマブ研究の治療割り付け 標的試験の特定 標的試験のエミュレーション 患者は非盲検下でベースライン時にいずれかの治療戦 略にランダム割り付けされる 患者は観察されたデータと一致する治療戦略に分類さ れ、ベースライン共変量の層内でのランダム化が想定 された (i) 条件付き交換可能性と (ii) 治療確率モデルが正しく特定されているという仮定が成り立てば、観察研究に おいて、標的試験のランダム化をエミュレートすることが可能 交絡調整のためのベースライン共変量として、既報や専門的知見に基づき、modified disjunctive cause criterionを満たす以下の変数を選択:人口統計学的特性、追跡開始年、骨粗鬆症の初回診断からの期間、初 回適格性 (維持透析と骨粗鬆症の両方) を満たしてからの期間、骨折歴および骨折手術歴、併存疾患の既往歴、 骨粗鬆症治療薬の使用歴、他の薬剤の使用歴、医療利用、維持透析の種類およびデータベース上の初回維持 透析からの期間 交絡変数によるベースラインの不均衡を調整するために、逆確率重み付け (inverse probability weighting) を適用 31
治療割り付けのエミュレーション RCTと観察研究の本質的な違いは主に2つ 1. RCT:ランダム化により、ベースライン交絡が平均的に存在しないと期待できる 観察研究:「十分な共変量セット (sufficient set of covariates) 」を条件付けして 、治療割り付けが潜 在アウトカムと独立に決まっているとみなす。ここでは「交絡変数がすべて測定されている (no unmeasured confounders)」という仮定が必要 2. RCT:治療割り付け確率が既知 (例:1:1のランダム化 → 50%の確率で治療群、50%の確率で対照群) 観察研究:共変量セットごとの治療割り付け確率は、正確に特定されたモデルから推定する 観察研究において、1は「条件付き交換可能性の仮定」、2は「治療確率モデルの正しい特定 (no model misspecification)」に対応し、これらの成立でRCTのランダム化をエミュレートできる 32
「十分な共変量セット」の特定:causal DAG 「十分な共変量セット」の特定には、研究対象に関する専門的知見 (subject-matter knowledge) が不可欠 因果有向非巡回グラフ (causal directed acyclic graph, causal DAG) は、研究者が仮定する因果関係を矢線 で可視化するツール ○ 因果効果の推定において調整すべき変数と調整を避けるべき変数を体系的に検討することを可能にする ○ ルールとして、巡回 (例:A ⇆ Yのようなループ) はないと仮定する バックドア基準 (backdoor criterion) は、治療AとアウトカムYの間にあるバックドアパス (backdoor path) を遮断できるように変数を選ぶ考え方 ○ 理論的には、条件付き交換可能性を成立させるのに十分な共変量セットを特定するためのゴールドスタン ダード ○ 実践においては、関連するすべての因果関係を正しく網羅したcausal DAGを描くのは難しい L A 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. Y 交絡変数L (年齢) は、治療A (スタチン) の受けやすさとア ウトカムY (急性心筋梗塞) のリスクの両方に影響するため、 調整する必要がある 33
「十分な共変量セット」の特定:modified disjunctive cause criterion Modified disjunctive cause criterionは、causal DAGの理論と実践のギャップを埋めるために提案された共 変量選択基準 詳細なcausal DAGの構築が困難な状況においても、十分な共変量セットを確からしく選定できる可能性の高 い実用的な戦略として評価されている 治療に先行して測定され、治療、アウトカム、またはその両方に影響を与える任意の共変量 (disjunctive causes) を調整対象とする ただし、治療にのみ関連するような操作変数 (instrumental variables) は調整から除外し (調整するとバイア スの原因になるため)、治療とアウトカムの共通原因との相関の大きな代理変数 (proxy variables) は含める という「修正」された指針を与える ○ 操作変数の例:居住地から最寄り病院までの距離は治療選択に影響するが、アウトカム自体には直接影響 しないため、調整すべきでない ○ 代理変数の例:収入を直接測定できない場合に、職業や居住地域を代わりに用いる 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 34
交絡調整手法 観察研究における交絡調整には、以下のような様々な手法が利用可能 ○ 層別 ○ 回帰モデリング ○ 共変量マッチング ○ 傾向スコアモデリング (傾向スコア層別・ 回帰調整、傾向スコアマッチング、逆確率重み付け) ○ G-methods (parametric g-formula、逆確率重み付け、構造ネストモデルのg-estimation) これらの手法はいずれも、同一の識別仮定 (条件付き交換可能性、因果一致性、条件付き正値性) および (層 別以外は) 相異なるモデリング仮定に依拠している 交絡調整手法の選択によって異なる推定対象 (どの集団における効果か?) が定義されるため、研究者は手法 を選択する前に関心のある因果効果を明確にする必要がある 実際の適用においては、推定対象および利用可能なデータの性質を考慮したうえで、各手法の特性 (どのよ うな仮定を含むか?) を踏まえて適切な方法を選択するか、または複数手法を適用してモデリング仮定の頑 健性を確認すべき 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 35
交絡調整手法のモデリング仮定と定義される推定対象 論文 (DOI: 10.3820/JJPE.30.E4) の表2より一部を抜粋 36
標的試験のプロトコルの構成要素 1. 適格基準 2. 治療戦略 3. 治療割り付け 因果的な推定対象 (causal estimands) 4. アウトカム 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 37
デノスマブ研究のアウトカム 標的試験の特定 標的試験のエミュレーション 安全性のアウトカム: 安全性のアウトカム: MACE (急性心筋梗塞、脳卒中、入院を伴う心不全、ま 標的試験と同じ (診断コードと医薬品または診療行為 たは心血管死) コードの組み合わせにより操作的に定義) 有効性のアウトカム: 骨折 (椎体、股関節、骨盤、大腿、下腿、足首、肩、 前腕、手首の骨折を含む) 有効性のアウトカム: 標的試験と同じ (診断コードと診療行為コードの組み 合わせにより操作的に定義) 冠動脈疾患が心不全入院の最も一般的な原因であるため、MACEには心不全も含めた MACEは、循環器専門医の臨床的知見に基づき、診断コードと医薬品または診療行為コードの組み合わせに よりイベント別に定義。日本でのバリデーション研究に照らし合わせると、これらの定義の陽性的中度は 100%に近いことが期待 (ただし、心血管死についてはバリデーション研究は実施されていない) 骨折は、米国のバリデーション研究を参照しつつ、整形外科専門医の臨床的知見から日本の実態に即すよう に、骨折部位の診断コードおよび特異的な診療行為コードの組み合わせによって定義し、陽性的中度は90% を超えることが期待 38
アウトカムを特定するためのアルゴリズム レセプトデータや電子カルテデータ等からアウトカムを定義する際は、アルゴリズムを使用する ○ アルゴリズムは、臨床ワークフローの知見と利用可能なデータに基づき、診断、診療行為、医 薬品処方、臨床検査結果、医療提供環境などから1つ以上の要素を組み合わせて構築 ○ アルゴリズムの妥当性は、患者の受診行動パターン、医療アクセスの格差、医療の質的相違、 鑑別診断の複雑性、あるいは除外診断のための暫定的コーディングなどの影響を受ける ○ アルゴリズムが関心のあるアウトカムを正確に捕捉できる保証はない バリデーション研究を通じてアルゴリズムの診断性能 (感度、特異度、陽性的中度、陰性的中度 など) を適切に評価することが重要 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 39
アルゴリズムの診断性能を評価するためのバリデーション研究 バリデーション研究では、より真に近いと考えられる情報 (ゴールドスタンダード) との比較を通 して、アルゴリズムの妥当性を評価することを目的とする ○ ゴールドスタンダードには、カルテレビュー、疾患レジストリ、検査結果を用いることが多い アルゴリズムの診断性能の評価には以下の4指標が用いられることが多い ゴールドスタンダード を満たすか を ア 満 ル た ゴ す リ か ズ ム 1. 感度:真に病気の患者のうち、アルゴリズムを満 たす患者の割合 Yes No Yes 真陽性 A 偽陽性 B PPV = A/(A+B) No 偽陰性 C 真陰性 D NPV = D/(C+D) 感度 = A/(A+C) 特異度 = D/(B+D) 2. 特異度:真に病気でない患者のうち、アルゴリズ ムを満たさない患者の割合 3. 陽性的中度 (PPV):アルゴリズムを満たす患者の うち、真に病気の患者の割合 4. 陰性的中度 (NPV):アルゴリズムを満たさない 患者のうち、真に病気でない患者の割合 40
検証されたアルゴリズムに関する留意点 既に検証されたアルゴリズムであっても、その検証が行われた集団が、アルゴリズム適用対象集 団の部分集団に過ぎない場合、あるいは本質的に異なる特性を持つ集団である場合には、アルゴ リズムの移送可能性を慎重に吟味する必要がある 基盤となる医療システム、診療ガイドライン、データ生成メカニズム等の相違により、ある特定 のデータソースにおいて妥当性が確認されたアルゴリズムが、異なるデータソースにおいても同 等の性能を発揮する保証はない 特定の期間において検証されたアルゴリズムが、異なる期間において同等の診断性能を維持する という仮定も、医療実践の進化や診断基準の変遷を考慮すれば、常に成立するとは限らない 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 井上 浩輔, 他. 医学研究のための因果推論レクチャー. 医学書院. 2024. 41
バリデーション研究がない場合 必ず臨床医に相談して定義する アウトカムを傷病名のみで定義するのは、適切ではないことがほとんど (精度、発生日の定義の 問題)。可能な限り医薬品や診療行為との組み合わせで定義する 傷病名の精度は、医科レセプト、DPC、電子カルテでかなり異なる 1. 医科レセプト:診療報酬請求目的。特異度が低いことが多い。外来、入院でも精度が異なる。 同一医療機関を同一傷病名で再診した場合、再診日の日データは記録されない (年月データは 記録される) 2. DPC:診療報酬請求目的ではないため、特異度は高いが、感度は低い。入院ごとにしか記録さ れない (主傷病名、入院の契機となった傷病名、医療資源を最も投入した傷病名、医療資源を 2番目に投入した傷病名、副傷病名、入院時併存傷病名、入院後発症傷病名)。入力できる傷 病数に上限がある。入院後に発生した傷病の診療開始日は特定不可能 3. 電子カルテ:診療報酬請求目的ではないため、精度は高いが、医師の専門性によって誤診があ りうる。 医科レセプト病名と違い、受診の度に病名記録が発生するわけではない 42
標的試験のプロトコルの構成要素 1. 適格基準 2. 治療戦略 3. 治療割り付け 因果的な推定対象 (causal estimands) 4. アウトカム 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 43
デノスマブ研究の追跡開始と終了 標的試験の特定 標的試験のエミュレーション 追跡は治療割り付け時点で開始され、関心のあるアウ トカムの発生、追跡不能、追跡の管理的終了 (追跡開 始から3年時点または2022年10月31日) のいずれか早 い日に終了する 標的試験と同じ (追跡不能は、データベースからの脱 落として定義) 推定対象:総合効果 (total effect) 競合イベントをそれ以降のアウトカム発生を妨げるイベントとして解釈し、競合イベントを経験した個人は アウトカム発生なしとして管理的終了まで追跡される 治療戦略からアウトカムに至るまでのすべての因果経路を捉えていると見ることが可能 集団全体が異なる治療戦略を受けた場合のアウトカム分布の比較となり、明確に定義された (well-defined) 因果効果として解釈可能 ただし、治療戦略が競合イベントを増加させる場合、アウトカムへの総合効果は保護的になりうるなど、因 果効果として明確に定義されていたとしても解釈に注意を要する 44
追跡開始時点 (time zero) ①研究への適格性の判定 (E)、②治療戦略の開始 (A)、③追跡開始時点 (T0) の3時点を一致させることが重要 一致させないと以下のバイアスが発生 Left truncation bias Prevalent user bias Depletion of susceptibles bias Immortal time bias Hernán MA et al. J Clin Epidemiol. 2016;79:70-75. 45
追跡開始と終了 追跡開始は、研究への適格性を満たし、かつ、治療戦略を開始した時点 (3時点の同期) 追跡終了は、関心のある「因果的な対比」に応じて異なる形で決定される ○ Intention-to-treat効果を推定する場合、以下によって決まる - 関心のあるアウトカムの発生 - 競合イベント (competing events) の発生:関心のあるアウトカムの発生を不可能にするイ ベント (例:心血管死をアウトカムとする研究では、他の原因による死亡が競合イベント) - 追跡不能 (loss to follow-up):レセプトデータベースであれば公的医療保険の変更、医療機 関データベースであれば最終受診 - 追跡の管理的終了 (administrative end of follow-up):規定した追跡期間の終了日 (例:追跡 開始から1年経過日)、データソースがカバーする時間範囲の最終日 (レセプトデータベース であれば各保険者/審査支払機関からの、医療機関データベースであれば各医療機関からの データ提供最終日) ○ Per-protocol効果を推定する場合、上記に加え、割り付けられた治療戦略から逸脱も考慮する 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 46
追跡終了時の考慮事項:競合イベント 競合イベントとは、関心のあるアウトカムの発生を不可能にするイベント (例:心血管死をアウ トカムとする研究では、他の原因による死亡が競合イベント) 競合イベントの存在下における主な推定対象は次の3つ 1. 複合アウトカムに対する効果 (effect on the composite outcome) 2. 総合効果 (total effect) 3. 制御された直接効果 (controlled direct effect) Young JG et al. Stat Med. 2020;39(8):1199-1236. 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 47
複合アウトカムに対する効果 (effect on the composite outcome) 競合イベントをアウトカムの構成要素として包含するアプローチ データの取り扱いは単純で分かりやすいが、当初の因果的な構成要素そのものを変質させ、推定 値は関心のあるアウトカムへの効果よりも競合イベ ントの発生パターンに左右される可能性 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 48
総合効果 (total effect) 競合イベントをそれ以降のアウトカム発生を妨げるイベントとして解釈し、競合イベントを経験 した個人はアウトカム発生なしとして管理的終了まで追跡 治療戦略からアウトカムに至るまでのすべての因果経路 (競合イベントを経由してアウトカム発 生を「予防」する間接経路を含む) を捉えていると見ることが可能 集団全体が異なる治療戦略を受けた場合のアウトカム分布の比較となり、明確に定義された (well-defined) 因果効果として解釈可能 ただし、治療戦略が競合イベントを増加させる場合、アウトカムへの総合効果は保護的になりう るなど、因果効果としては明確に定義されていたとしても解釈に注意を要する 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 49
制御された直接効果 (controlled direct effect) 競合イベントをアウトカム発生ではなく、アウトカム観察を妨げる「打ち切り」イベントとして 解釈 競合イベントを打ち切りとして扱うことは、競合イベントを排除するような介入により、競合イ ベントが発生しない状態に制御した下での、治療戦略からアウトカムへの直接効果と見ることが 可能 この推定対象はすべての競合イベントを防ぐという介入を想定するため、現実には達成困難な仮 想的介入に依存している可能性があり、その場合には、この制御された直接効果は明確に定義さ れない (ill-defined) 因果効果となる 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 50
標的試験のプロトコルの構成要素 1. 適格基準 2. 治療戦略 3. 治療割り付け 因果的な推定対象 (causal estimands) 4. アウトカム 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 51
デノスマブ研究の因果的な対比 標的試験の特定 標的試験のエミュレーション Intention-to-treat効果: 効果指標は、3年リスク、リスク差、リスク比 Intention-to-treat効果の観察研究におけるアナロジー (observational analog): 効果指標は、標的試験と同じ 標的試験エミュレーションにおいては、intention-to-treat効果とper-protocol効果という2つの因果的な対比 がよく取り上げられる ○ Intention-to-treat効果:治療戦略への割り付け効果 (時間固定治療の比較) ○ Per-protocol効果:割り付けられた治療戦略を遵守した場合の効果 (時間依存性治療の比較) 観察研究では特定の治療戦略へ実際に割り付けているわけではないため、intention-to-treat効果自体をエ ミュレートできることは稀 代わりに、intention-to-treat効果の観察研究におけるアナロジー (observational analog) として、「治療戦 略を開始すること」の効果が定義される 52
RCTにおけるintention-to-treat効果 Intention-to-treat効果は治療戦略への割り付け効果であり、実際のアドヒアランスとは無関係に定義される 解釈には主に3つの論点が存在 1. 二重盲検下ではどの対象者に対しても真の治療効果が存在しなければintention-to-treat効果も存在しな いことが期待されるが、非盲検下では治療割り付けそのものが医師や患者の行動変容を通じてアウトカ ムに影響を与えうるため、真の治療効果が存在することがintention-to-treat効果が存在することに含意 されない 2. Intention-to-treat効果は一般にper-protocol効果よりも保守的 (効果が小さい) と考えられているが、治 療に非単調効果が存在する場合 (つまり一部の患者には有益だが他の患者には有害である場合)、 intention-to-treat効果はper-protocol効果より大きくなったり、逆方向になったりすることがある 3. Intention-to-treat効果は不完全な治療アドヒアランスを組み込んでいるため、実臨床での治療効果を反 映すると主張されるが、その根拠は弱い。特定のRCTで観察されたアドヒアランスパターンは、他の RCTや臨床現場のそれとは異なる可能性が高い 以上から、RCTであっても特に安全性試験や非劣性試験において、intention-to-treat効果のみに依拠するこ とは、リスクを過小評価したり臨床的に重要な差異を覆い隠したりする可能性があるため、正当化しにくい 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 53
RCTにおけるper-protocol効果 Per-protocol効果は、割り付けられた治療戦略を遵守した場合の効果を意味し、治療戦略の実際の効果を知 りたい医師や患者にとって、より直接的な関心の対象 しかし、治療・交絡変数フィードバックの存在下においてper-protocol効果をバイアスなく精確に推定する には、RCTであっても治療アドヒアランスを予測する共変量のデータを収集し、g-methodsを原理にもつ適 切な解析手法が必要となる (実際には、ほとんどのRCTでこれができていないため、推定値にバイアスが生 じている可能性) 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 54
観察研究におけるintention-to-treat効果とper-protocol効果 観察研究では特定の治療戦略へ実際に割り付けているわけではないため、intention-to-treat効果をエミュ レートできることは稀 ○ 代わりに、intention-to-treat効果の観察研究におけるアナロジーとして、「治療戦略を開始すること」の 効果が定義される ○ これはベースライン後の治療アドヒアランスパターンを問わない点で、intention-to-treat効果の概念的特 性を継承 Per-protocol効果の観察研究におけるアナロジーは、「開始された治療戦略を遵守した場合の効果」として 定義される 観察研究におけるintention-to-treat効果の推定には治療開始とアウトカムに影響を与える共変量の調整が、 それに加えてper-protocol効果の推定にはRCTと同様に、治療アドヒアランスに影響を与える共変量の適切 な測定と調整が必要 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 55
標的試験のプロトコルの構成要素 1. 適格基準 2. 治療戦略 3. 治療割り付け 因果的な推定対象 (causal estimands) 4. アウトカム 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 56
デノスマブ研究の解析方法 標的試験の特定 標的試験のエミュレーション Intention-to-treat解析: Intention-to-treat解析: 各治療戦略における累積発生率曲線から3年リスク (累 標的試験と同じ 積発生率)、リスク差、リスク比を推定 多くの因果的な問いは「アウトカム発生までの時間 に対する治療効果」に関わるため、生存時間解析が 必要 CoxモデルはRCTと観察研究における標準的手法と されてきたが、このモデルから得られるハザード比 には解釈上の限界が存在し、因果的に解釈できない 絶対リスク (累積発生率) に基づく比較であれば、 因果的な解釈が可能になる 57
Coxモデルによるハザード比の因果的解釈 ハザード比は一般に因果的に解釈できない ○ Coxモデルでは、ハザード比は時点t によらず一定という仮定 (proportional hazards assumption) だが、 通常成り立たない - ハザード比は時間とともに変化することが多い - その場合、報告される単一のハザード比は時点ごとのハザード比の加重平均にすぎない ○ ハザード比には、ハザードに内在する選択バイアスが構造的に組み込まれている (built-in selection bias) - 時点t におけるハザード比は、時点t -1まで生存した条件付き集団での比較となるが、治療がアウトカ ムに効果を持つ場合、治療初期にイベントを経験しやすい (susceptible) 対象者が選択的に除外される ことで、治療群ごとのハザードには選択バイアスが生じ (depletion of susceptibles)、因果的な解釈が 難しい これらの課題に対処するために、絶対リスク (累積発生率) に基づく比較指標が推奨 ○ ハザード比が追跡期間全体を通じて一定であるという仮定を要さず、因果的な解釈も可能 深澤 俊貴, 他. 薬剤疫学. 2025;30(2):53-73. 58
デノスマブ研究の結果 デノスマブは経口ビスホスホネート製剤に比して、心血管リスクを増加、骨折リスクを低下させる可能性 MACE:3年リスク差 8.2% (95% CI, –0.2% to 16.7%)、3年リスク比 1.36 (95% CI, 0.99 to 1.87) 骨折:3年リスク差 –5.3% (95% CI, –11.3% to –0.6%)、3年リスク比 0.55 (95% CI, 0.28 to 0.93) 59
まとめ 標的試験エミュレーションは、観察研究における因果推論を強化するためのフレームワーク 標的試験フレームワークの最大の貢献は、因果的な問いに内在する曖昧さを大幅に解消し、観察 研究を介した効果推定の妥当性を高めること ○ 問いが不明瞭なままでは、解釈困難な効果推定値を生み出すだけであり、その推定値から科学 的・臨床的意思決定への活用を正当化することはできない 標的試験エミュレーションは、研究デザインに起因するバイアスを防止することはできるが、交 絡および選択バイアスを調整するための情報の欠如や測定誤差といったデータそのものの限界か ら生じるバイアスを排除するものではない ○ しかし、デザインバイアスを回避することで、標的試験フレームワークは研究者にデータバイ アスに焦点を当てさせ、それらの制約が将来の研究においていかに緩和できるかを検討する機 会を提供する 60