データベース研究

154 Views

June 26, 25

スライド概要

慶應義塾大学大学院薬学研究科 薬剤疫学・データサイエンス特論
2025年5月28日

profile-image

京都大学大学院医学研究科社会健康医学系専攻薬剤疫学分野 特定講師

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

慶應義塾大学 薬剤疫学・データサイエンス特論 2025年5月28日 データベース研究 深澤 俊貴 京都大学大学院医学研究科 社会健康医学系専攻 薬剤疫学分野 [email protected] 1

2.

経歴・資格 学位 2017年 学士 (薬科学) 慶應義塾大学薬学部 2019年 修士 (薬科学) 慶應義塾大学大学院薬学研究科 2024年 博士 (医学) 京都大学大学院医学研究科 職歴 2019年 – 2020年 2020年 – 2024年 2024年 – 現在 2020年 – 2024年 2024年 – 現在 東北大学病院臨床研究推進センター 助手 京都大学大学院医学研究科薬剤疫学分野/デジタルヘルス学講座 特定助教 京都大学大学院医学研究科薬剤疫学分野 特定講師 リアルワールドデータ株式会社 シニアコンサルタント (兼業) 株式会社JMDC アドバイザー (兼業) 資格 日本疫学会認定疫学専門家、日本薬剤疫学会認定薬剤疫学家 2

3.

到達目標  医療情報データベースとは何か、いつ・どこで・どのように生み出されるかを理解する  医療情報データベースに内在する様々な限界を理解する  データベース研究の事例を通して、どのように研究が計画され、実施されるのかを理解する 3

4.

アウトライン 1 日本の医療保険制度と医療情報データベース 2 医療情報データベースの構造と利用上の留意点 (レセプトデータを中心に) 3 研究事例 4

5.

アウトライン 1 日本の医療保険制度と医療情報データベース 2 医療情報データベースの構造と利用上の留意点 (レセプトデータを中心に) 3 研究事例 5

6.

日本の医療保険制度 特徴1:国民皆保険 すべての国民が公的医療保険に加入することを保証 特徴2:フリーアクセス 紹介状なしで、あらゆる医療機関にアクセスできることを保証 特徴3:現物給付 医療を一部自己負担金のみで受けられる 国民皆保険達成から50周年を迎える機会に、 その経験を国際社会に共有することを目的 として、2011年にLANCETから出版 The Lancet – Japan: Universal Health Care at 50 Years. https://www.thelancet.com/series/japan 6

7.

特徴1:国民皆保険 公的医療保険 保険者 (保険者数) 保険加入者 (加入者数) 健康保険組合 (1,388団体) 大企業の従業員とその扶養家族 (2,838 万人) 被用者保険 組合管掌健康保険 (組 合健保) 全国健康保険協会管掌 全国健康保険協会 (1団体) 健康保険 (協会けんぽ) 中小企業の従業員とその扶養家族 (4,027万人) 共済組合 (85団体) 公務員とその扶養家族 (869万人) 国民健康保険 市町村国保、国民健康保険組合 (1,716団体) 自営業者、年金生活者、非正規雇用者 とその扶養家族 (2,537万人) 後期高齢者医療制度 後期高齢者医療広域連合 (47団体) 75歳以上 (1,843万人) 共済組合保険 厚生労働省「我が国の医療保険について」をもとに作成 (保険者数、加入者数は2022年3月時点) 7

8.

特徴2:フリーアクセス 日本 例.イギリス、オランダ、カナダなど 一次医療 家庭医 (general practitioner, GP) 二次医療 三次医療 二次、三次医療 8

9.

特徴3:現物給付 医 療 費 総 額 自己負担金 2割 0–5歳 3割 6–69歳 2割 1割 70–74歳* ≥75歳* *現役並み所得者は3割 9

10.

保険診療とリアルワールドデータの生成 保険加入者 保険者 保険医療機関 保険薬局 レセプト レセプト 審査支払機関 医療機関データベース レセプトデータベース 10

11.

レセプトデータのみ レセプトデータと検査値データ 世界の医療情報データベース レセプト データベース 医療機関 データベース プライマリーケア データベース 統合ヘルスケア データベース 一次医療 一次医療 一次医療 一次医療 専門医療 入院医療 専門医療 入院医療 専門医療 入院医療 専門医療 入院医療

12.

レセプトデータのみ レセプトデータと検査値データ 日本の医療情報データベース レセプト データベース 医療機関 データベース 一次医療 一次医療 専門医療 入院医療 専門医療 入院医療 12

13.

日本の医療情報データベース 日本薬剤疫学会. 日本における薬剤疫学に応用可能なデータベース調査. https://www.jspe.jp/committee/kenkou-iryou/ 13

14.

日本の医療情報データベース 日本薬剤疫学会の健康・医療情報データベース活用委員会が行っている「日本における薬剤疫学に応用可能な データベース調査」をもとにした論文 Kumamaru H et al. Pharmacoepidemiol Drug Saf. 2024;33(1):e5680. 14

15.

日本の医療情報データベース JMDC保険者データベース Nagai K et al. J Gen Fam Med. 2021;22(3):118-127. JMDC電子カルテデータベース(旧RWDデータベース) Okumura Y et al. Ann Clin Epidemiol. 2024;6(3):58-64. JMDC医療機関データベース Nagai K et al. J Gen Fam Med. 2020;21(6):211-218. DeSCデータベース Yasunaga H. Ann Clin Epidemiol. 2025;7(2):46-49. 15

16.

日本のレセプトデータベース 主な公的DB NDB 網羅性 * 追跡性 ◎ 主な民間DB KDB JMDC 保険者DB JMDC 後期高齢者DB DeSC DB △ △ △ 〇 組合健保、共済、 国保 後期高齢者 組合健保、国保、 後期高齢者 ほぼ全国民 (組合健保、 国保、後期高齢者 協会けんぽ、共済、 国保、後期高齢者) ◎ 転院しても可 検査値 取得 △ 健診データから 限定的に可 *保険ごとに対象者が異なるため、DBごとにカバーする対象者の年齢、性別、職種に偏りがある 16

17.

レセプトデータベース:生成の流れ 保険加入者 保険者 保険医療機関 保険薬局 レセプト レセプト KDB JMDC DB DeSC DB 審査支払機関 NDB 17

18.

レセプトとは 外来 医科入院外レセプト 医科入院レセプト 医科医療機関 入院 DPCレセプト 調剤 調剤レセプト 歯科 歯科レセプト 保険薬局  レセプトは、診療報酬明細書の 通称  保険加入者が受けた診療内容が 記録される  医科レセプト (入院外/入院)、 DPCレセプト、調剤レセプト、 歯科レセプトの4種類  各保険医療機関・薬局から保険 加入者ごとに月締めで発行され、 審査支払機関を通じて保険者に 集積 歯科医療機関 18

19.

レセプトデータベース:強み  追跡性の高さ:保険者を変更しない限り、転院や複数の医療機関受診があったとしても、全ての保険診療情 報を施設横断的に追跡可能  一般集団において有病割合、発生率を推定可能 (NDB or 被保険者台帳データを有するデータベース) 株式会社JMDC. JMDC Claims Database. https://www.jmdc.co.jp/jmdc-claims-database/ 19

20.

レセプトデータベース:弱み  傷病名の不正確さ:本当はその傷病を有していなくとも、保険病名として記録されうる → バリデーション研究の実施、アルゴリズムの開発により対処  処方や調剤の記録が必ずしも患者の服薬を意味しない  臨床検査値データがDBに格納されていない (特定健診、フレイル健診データとは突合可能) Fukasawa T et al. J Epidemiol. 2020;30(2):57-66. 20

21.

レセプトデータベース:傷病を特定するためのアルゴリズム 例:SJS/TENを特定するためのアルゴリズム (感度76.9%、特異度99.0%) Fukasawa T et al. PLoS One. 2019;14(8):e0221130. 21

22.

レセプトデータベース:研究事例 (非常に稀なアウトカム) Step 1. 傷病を特定するアルゴリズムの開発 Step 2. リスク評価 Fukasawa T et al. PLoS One. 2019;14(8):e0221130. Fukasawa T et al. Allergol Int. 2021;70(3):335-342. Fukasawa T et al. J Allergy Clin Immunol Pract. 2023;11(11):3463-3472. 22

23.

レセプトデータベース:研究事例 (透析患者)  透析患者は骨粗鬆症の罹患割合が高いも のの、治験では対象外となる集団  骨粗鬆症を併存する維持透析患者におけ るデノスマブ vs. 経口ビスホスホネート の心血管安全性と骨折予防効果の比較 Masuda S et al. Ann Intern Med. 2025;178(2):167-176. 23

24.

日本の医療機関データベース 主な公的DB 網羅性 主な民間DB MID-NET DPC研究班 JMDC 医療機関DB JMDC 電子カルテDB MDV DB △ △ △~〇 △~〇 △ DPC病院 DPC病院 DPC/非DPC病院 DPC/非DPC病院、 診療所 DPC病院 × 追跡性 転院すると不可 検査値 取得 ◎ × △ ◎ △ 全ての契約医療機関 から可 不可 一部の契約医療機関 から可 全ての契約医療機関 から可 一部の契約医療機関 から可 24

25.

医療機関データベース:生成の流れ 保険加入者 保険者 保険医療機関 保険薬局 レセプト レセプト 審査支払機関 医療機関データベース 25

26.

DPCとは  DPCは、Diagnosis Procedure Combinationの略称  入院期間中に医療資源を最も投入した「傷病名」と入院期間中に提供される「診療行為」の組み 合わせにより、患者群を分類する  DPCは、急性期入院医療を対象とした診療報酬の包括評価制度 (DPC制度) にも利用されており、 その制度下においてDPCデータが作成される  DPC制度下では、入院期間中に治療した傷病の中で医療資源を最も投入した一傷病のみに対して、 1日あたりの定額点数から成る包括報酬 (入院基本料、検査、画像診断、投薬、注射など) が計算 され、これに出来高報酬 (手術、麻酔、放射線治療、医学管理など) を合算することにより、入院 医療費が算定される  DPC制度を採用している病院はDPC病院と呼ばれ、一般病床を有する日本の全病院の約35%を占 める  DPCデータは、DPCレセプトと混同されやすいが、別物 26

27.

DPCデータベース:強みと弱み 強み  様式1 (退院時サマリ) からは入院時の身長、体重、喫煙歴、各種臨床スコア等を入手可  DPC病名に関しては、医科レセプト病名と違い、医師が次の6つを区別して入力:①主傷病名、 ②入院の契機となった傷病名、③医療資源を最も投入した傷病名、④医療資源を2番目に投入した 傷病名、⑤入院時併存傷病名、⑥入院後発症傷病名  出来高報酬制度と異なり、医師が保険病名を入力するインセンティブがないため、 DPC病名の特 異度は高い 弱み  DPC病名の感度の低さ:医療費の請求に用いられない傷病は、患者がそれを有していてもデータ 入力する必要がないことや、入力できる傷病数に上限がある等の理由で、感度は低い  追跡性の低さ:同一病院内での縦断的な患者追跡は可能であるものの、患者が他の医療機関で受 けた診療記録は捕捉できないため、施設横断的な追跡性はない  研究結果の一般化可能性:急性期医療の実態を正確に反映するかもしれないが、診療所や慢性期 医療の現場には一般化できない可能性あり 27

28.

DPCデータベース:様式1 (退院時サマリ) の診療関連情報           身長、体重、BMI 喫煙指数 (Brinkman index) 認知症自立度 入院経路、退院先 入・退院時ADL (Barthel index) 意識障害患者の意識レベル (Japan Coma Scale) 肝硬変のChild-Pugh分類 熱傷患者におけるBurn index がんのUICC TNM分類、Stage … 株式会社健康保険医療情報総合研究所. 2025年度DPCの評価・検証等に係る調査関連情報. https://www01.prrism.com/dpc/2025/top.html 28

29.

DPCデータに関する情報 株式会社健康保険医療情報総合研究所. 2025年度DPCの評価・検証等に係る調査関連情報. https://www01.prrism.com/dpc/2025/top.html 29

30.

DPCデータベース:研究事例 (整形外科手術)  整形外科手術の術前に標準的に使用されるセファゾリンが、 2019–2020年にかけて、日本の病院の約60%で供給不足  下肢骨折の観血的整復固定術を対象に、セファゾリン vs. 他の βラクタム系抗菌薬の創部感染予防効果を比較  入院期間内で完結する研究セッティングにするのがポイント  Point interventionsの比較におけるtarget trial emulation Yoshiyama T et al. Injury. 2025;56(3):112215. 30

31.

電子カルテデータベース:強みと弱み 電子カルテは、日常診療で取得される大量の医療データを電子的に管理するシステム 強み  患者の健康管理を目的に、医師が傷病名を入力しているので正確性が高い (ただし、医師の専門 性による)  多種の臨床検査値データを格納 ○ 腎機能、肝機能、炎症マーカーなどの経時推移を観察 ○ 検査値をもとに分類したサブグループごとに、医薬品の有効性、安全性を評価 弱み  臨床検査値データの測定タイミング:患者ケアの必要に応じて検査値が測定されるため、我々が 期待するタイミングにて必ずしもそのデータを得られるわけではない  追跡性の低さ:同一病院内での縦断的な患者追跡は可能であるものの、患者が他の医療機関で受 けた診療記録は捕捉できないため、施設横断的な追跡性はない 31

32.

傷病名の妥当性 傷病名の精度は、医科レセプト、DPC、電子カルテでかなり異なる  医科レセプト:診療報酬請求目的。特異度が低いことが多い。外来、入院でも精度が異なる。同 一医療機関を同一傷病名で再診した場合、再診日の日データは記録されない (年月データは記録 される)  DPC:診療報酬請求目的ではないため、特異度は高いが、感度は低い。入院ごとにしか記録され ない (主傷病名、入院の契機となった傷病名、医療資源を最も投入した傷病名、医療資源を2番 目に投入した傷病名、副傷病名、入院時併存傷病名、入院後発症傷病名)。入力できる傷病数に上 限がある。入院後に発生した傷病の診療開始日は特定不可能  電子カルテ:診療報酬請求目的ではないため、精度は高いが、医師の専門性によって誤診があり うる。 医科レセプト病名と違い、受診の度に病名記録が発生するわけではない 関心のある傷病名に対するバリデーション研究がなければ、必ず臨床医にその妥当性を相談する  アウトカムを傷病名のみで定義するのは、適切ではないことがほとんど (精度、発生日の定義の 問題)。感度、特異度とのバランスを考えながら、可能な限り医薬品や診療行為との組み合わせで 定義する 32

33.

電子カルテデータベース:研究事例 (臨床検査値の経時推移)  旭化成ファーマ社、リアル ワールドデータ社との共同 研究  ステロイドを開始したリウ マチ性多発筋痛症患者にお けるCRPの経時推移 (ただ し、時点毎に検査結果を有 する患者数が変動するため、 選択バイアスが内在) Tanaka Y et al. Joint Bone Spine. 2024;91(3):105680. 33

34.

アウトライン 1 日本の医療保険制度と医療情報データベース 2 医療情報データベースの構造と利用上の留意点 (レセプトデータを中心に) 3 研究事例 34

35.

レセプト電算処理システムに関する情報 厚生労働省保険局. 診療報酬情報提供サービス. https://shinryohoshu.mhlw.go.jp/shinryohoshu/receMenu/doReceInfo 35

36.

レセプトデータの構造 レセプトデータは各種レコードに分割され、レコード単位でNDBに格納 (下図は医科レセプトの例) レセプト共通レコード (RE) → 性別、年齢、診療年月など 医療機関情報レコード (IR) → 医療機関コード、都道府県など 傷病名レコード (SY) → 傷病名コード、転帰など 保険者レコード (HO) → 診療実日数、合計点数など 診療行為レコード (SI) → 診療行為コード、量など 医薬品レコード (IY) → 医薬品コード、量、回数など 厚生労働省. NDBの利用を検討している方へのマニュアル. https://www.mhlw.go.jp/content/12401000/000557476.pdf 36

37.

医科レセプト DPCレセプト 調剤レセプト レセプト管理レコード (MN) レセプト管理レコード (MN) レセプト管理レコード (MN) 医療機関情報レコード (IR) 医療機関情報レコード (IR) 薬局情報レコード (YK) レセプト共通レコード (RE) レセプト共通レコード (RE) レセプト共通レコード (RE) 保険者レコード (HO) 保険者レコード (HO) 保険者レコード (HO) 公費レコード (KO) 公費レコード (KO) 公費レコード (KO) 傷病名レコード (SY) 傷病名レコード (SY) 処方基本レコード (SH) 医薬品レコード (IY) 医薬品レコード (IY) 調剤情報レコード (CZ) 診療行為レコード (SI) 診療行為レコード (SI) 医薬品レコード (IY) 特定器材レコード (TO) 特定器材レコード (TO) 特定器材レコード (TO) コメントレコード (CO) コメントレコード (CO) コメントレコード (CO) 日計表レコード (NI) 日計表レコード (NI) 摘要欄レコード (TK) 症状群記レコード (SJ) 症状群記レコード (SJ) 基本料・薬学管理料レコード (KI) 臓器提供医療機関情報レコード (TI) 臓器提供医療機関情報レコード (TI) 分割技術料レコード (ST) 厚生労働省. NDBの利用を検討し ている方へのマニュアル. https://www.mhlw.go.jp/conten t/12401000/000557476.pdf 奥村泰之. NDBデータハンドリン グの工夫. https://icer.tokyo/materials/ach ievements/ 各種レコードを統合し、 テーブルデータに変換 臓器提供者レセプト情報レコード (TR) 臓器提供者レセプト情報レコード (TR) 臓器提供者請求情報レコード (TS) 臓器提供者請求情報レコード (TS) 包括評価対象外理由レコード(GR) 包括評価対象外理由レコード(GR) 診断群分類レコード(BU) 傷病レコード(SB) 患者基礎レコード (KK) 診療関連レコード (SK) 外泊レコード (GA) 包括評価レコード (HH) テーブル名 情報源 レセプト RE, HO, BU 傷病 SY, SB, BU 医薬品 IY, CZ, SH, CD (IYとCDの重複分は削除*) 診療行為 SI, CD (SIとCDの重複分は削除*) IR 合計調整レコード (GT) 診療行為レコード (SI) コーディングレコード (CD) *特定入院期間 (診断群分類ごとに定められている算定期間) を超える場合 37

38.

リレーショナルデータベース  IDで個人を特定、データを連結  レセプト通番でレセプトを特定、データを連結 ID レセプト通番 性別 生年月 … XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX ID XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX レセプト通番 傷病名コード 診療開始日 … XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX ID XXXXX XXXXX XXXXX XXXXX XXXXX レセプト通番 医薬品コード 処方日 XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX ID XXXXX XXXXX レセプト テーブル 傷病 テーブル XXXXX … XXXXX XXXXX XXXXX XXXXX XXXXX レセプト通番 診療行為コード 実施日 XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX … XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX 医薬品 テーブル 診療行為 テーブル 38

39.

リレーショナルデータベース  傷病名コード、医薬品コード、診療行為コードを用いて、各種マスターと連結することにより、 詳細情報を付加 ID レセプト通番 傷病名コード 診療開始日 … XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX 傷病名コード 傷病名基本名称 ICD-10-1 ICD-10-2 … XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX XXXXX 傷病テーブル 傷病マスター 39

40.

レセプトテーブル 項目 医科レセプト DPCレセプト 調剤レセプト ID RE RE RE レセプト通番 RE, HO, IR RE, HO, BU, IR RE, HO 診療年月 RE RE RE 入院年月日 ― BU ― 退院年月日 ― BU ― 性別 RE RE RE 年齢階層コード RE RE RE 医療機関コード IR IR RE 都道府県 IR IR RE 入院外来区分 RE ― ― 点数 HO HO HO 奥村泰之. NDBを用いた臨床疫学研究の留意点. https://icer.tokyo/materials/achievements/ 40

41.

傷病テーブル 項目 医科レセプト DPCレセプト 調剤レセプト ID RE RE RE レセプト通番 SY SY, SB, BU ― 傷病名コード SY SY, SB ― 疑い病名フラグ SY SY, SB ― 傷病名区分 ― SB ― 診療開始日 SY SY ― 転帰区分 SY SY, BU ― 奥村泰之. NDBを用いた臨床疫学研究の留意点. https://icer.tokyo/materials/achievements/ 41

42.

医薬品テーブル 項目 医科レセプト DPCレセプト* 調剤レセプト ID RE RE RE レセプト通番 IY IY, CD IY, CZ, SH† 医薬品コード IY IY, CD IY 処方日 IY IY, CD CZ 調剤日 ― ― CZ 処方日数 IY IY, CD CZ (調剤数量) 1日処方量 IY IY, CD IY 頓服フラグ IY IY, CD SH * IYとCDの重複分は削除 †IY、CZ、SHレコードはレセプト通番と処方番号を用いることで突合可能 奥村泰之. NDBを用いた臨床疫学研究の留意点. https://icer.tokyo/materials/achievements/ 42

43.

診療行為テーブル 項目 医科レセプト DPCレセプト* 調剤レセプト ID RE RE RE レセプト通番 SI SI, CD ― 診療行為コード SI SI, CD ― 実施日 SI SI, CD ― 回数 SI SI, CD ― 数量 SI SI, CD ― * SIとCDの重複分は削除 奥村泰之. NDBを用いた臨床疫学研究の留意点. https://icer.tokyo/materials/achievements/ 43

44.

傷病名マスター 項目 説明 傷病名コード 一般財団法人 医療情報システム開発センター (MEDIS-DC) が作成しているレ セプト電算処理システムコード 傷病名基本名称 MEDIS-DCが作成している傷病名 ICD-10-1 国際疾病分類第10版 (ICD-10) コード (基礎疾患の分類番号) ICD-10-2 国際疾病分類第10版 (ICD-10) コード (症状発現の分類番号) 例.糖尿病性白内障:「ICD-10-1」には糖尿病のICD-10コード「E143」を入力し、 「ICD-10-2」には白内障のICD-10コード「H280」を入力 → 白内障を特定したい場合、ICD-10-1だけを使うと「糖尿病性白内障」を取りこぼす 社会保険診療報酬支払基金. レセプト電算処理システム マスターファイル仕様説明書. https://shinryohoshu.mhlw.go.jp/shinryohoshu/file/spec/R06rec1.pdf 44

45.

ICD-10コード 世界保健機関 (WHO) が作成した分類であり、死亡や疾病のデータを体系的に記録、分析、解釈、 比較するために用いられる ICD10 国際疾病分類第10版 (2013年版). http://www.byomei.org/icd10/ 45

46.

ICD-10コードの構成と傷病名コードとの対応関係 コード/分類 説明 例 ICD-10コード  基本分類 傷病の類似性をもとに分類。第1桁はア 内分泌、栄養及び代謝疾患:E00–E90 ルファベット、第2桁と第3桁は数字。 ICD10 国際疾病分類第10版 (2013年版) の「章」に対応  3桁–5桁の分類 1つの傷病に対して1傷病名表現になる ようにICD-10を細かく分類 傷病名コード 1つの傷病に対して1傷病名表現、1傷病 2型糖尿病性白内障:8844347 名コードになるように、MEDIS-DCが 2型糖尿病性網膜症:8830045 作成しているレセプト電算処理システ ムコード 2型糖尿病性白内障:E113 2型糖尿病性網膜症:E113 この2つが対応関係にある 46

47.

医薬品マスター 項目 説明 医薬品コード レセプト電算処理システムコード。1桁目は「6」 薬価基準収載医薬品コード 厚生労働省が定める薬価基準収載品目につけられた12桁のコード 個別医薬品コード (YJコード) 薬価基準収載医薬品コードを拡張し、すべての商品を区別できるようにした12 桁のコード EphMRA-ATCコード 欧州医薬品市場調査協会 (EphMRA) の解剖治療化学分類法 (ATC) に基づく コード WHO-ATCコード WHOのATCに基づくコード 医薬品名 医薬品の販売名 成分名 医薬品の有効成分名 投与経路 薬価基準収載医薬品コードの投与経路の情報に準拠した分類 剤形 薬価基準収載医薬品コードの剤形の情報に準拠した分類 KEGG: Kyoto Encyclopedia of Genes and Genomes. 医薬品コード. https://www.kegg.jp/kegg/medicus/drugcode_ja.html 47

48.

薬価基準収載医薬品コード/YJコード  厚生労働省が定める薬価基準収載品目につけられた12桁のコード  薬価基準収載医薬品コードとYJコードの違いは、データインデックス株式会社の『情報医療ナ レッジ』を参照  コードの各桁の意味は以下の通り 2149039F1015 「ロサルタンカリウム25mg錠」の例 A B CD E F A:薬効分類番号 (日本標準商品分類「87 医薬品及び関連製品」のサブカテゴリーに対応した薬効分類) B:投与経路及び成分 (内服薬:001–399、注射薬:400–699、外用薬:700–999) C:剤形 (A–E:散剤、F–L:錠剤、M–P:カプセル、Q–S:液剤、T, X:その他) D:上記A–Cによる同一分類内の規格単位ごとの番号 E:上記Dによる同一規格内の番号 (統一名収載品目の場合は01) F:チェックデジット (読み取りミスなどをチェックするために他の桁の値から計算式で求められる数字) KEGG: Kyoto Encyclopedia of Genes and Genomes. 医薬品コード. https://www.kegg.jp/kegg/medicus/drugcode_ja.html データインデックス株式会社. 情報医療ナレッジ. https://www.data-index.co.jp/knowledge/146/ 48

49.

EphMRA-ATCコード/WHO-ATCコード  解剖治療化学分類法 (Anatomical Therapeutic Chemical Classification System) に基づくコード  EphMRA-ATCコードとWHO-ATCコードの2種類があるので、注意 ○ EphMRA-ATCコード:主な用途は、製薬会社のマーケティング ○ WHO-ATCコード:主な用途は、医薬品の使用実態や副作用を調査する薬剤疫学研究  WHO-ATCコードの各桁の意味は以下の通り C09CA01 「ロサルタン」の例 レベル1:解剖学的部位に基づいたメイングループ レベル2:治療法サブグループ レベル3:薬理学サブグループ レベル4:化学サブグループ レベル5:化学物質 KEGG: Kyoto Encyclopedia of Genes and Genomes. 医薬品コード. https://www.kegg.jp/kegg/medicus/drugcode_ja.html データインデックス株式会社. 情報医療ナレッジ. https://www.data-index.co.jp/knowledge/146/ 49

50.

効能効果の対応標準病名  一般財団法人日本医薬情報センター (JAPIC) が開発したシステム  医療用医薬品添付文書の「効能効果」に対応する「標準病名」を関連付け、相互に検索  病名、商品名、一般名、薬効分類、ICD10から検索可能  添付文書の「効能効果」と対応する「標準病名」の結び付けは、JAPICが専門家による妥当性の 評価を受けて独自に作成  医療のIT化を推進しようとする内閣府や厚生労働省の戦略の一助となるよう広く一般に無料公開 一般財団法人日本医薬情報センター. 効能効果の対応標準病名. https://www.byomei.jp/byomei-public/#/public 50

51.

効能効果の対応標準病名 ロサルタンカリウム錠25mg「アメル」の検索例 一般財団法人日本医薬情報センター. 効能効果の対応標準病名. https://www.byomei.jp/byomei-public/#/public 51

52.

診療行為マスター 項目 説明 診療行為コード レセプト電算処理システムコード。1桁目は「1」 診療行為名 診療報酬情報提供サービスの医科診療行為マスターの診療行為省略名称 区分番号 医科診療報酬点数表に記載されているアルファベットと数字からなる番号 社会保険診療報酬支払基金. レセプト電算処理システム マスターファイル仕様説明書. https://shinryohoshu.mhlw.go.jp/shinryohoshu/file/spec/R06rec1.pdf 52

53.

診療行為の区分 医科診療報酬 区分番号のアルファベット 基本診療料 A 初・再診料、入院料等 B 医学管理等 C 在宅医療 D 検査 E 画像診断 F 投薬 G 注射 H リハビリテーション I 精神科専門療法 J 処置 K 手術 L 麻酔 M 放射線治療 N 病理診断 O その他 特掲診療料 分類 医学通信社. 診療点数早見表 2024年度版. 53

54.

「レセプトデータの構造と利用上の留意点」に関する詳細なスライド 深澤俊貴. レセプトデータの構造と管理. https://www.docswell.com/s/toshikifukasawa/5J4QQJ-2024-12-03-204653 54

55.

目的に適ったデータベースの選択 データベース選択で特に重要なポイント 1. 対象集団:データベースの規模、対象範囲、代表性は適切か? 2. 研究の各種設定項目:曝露、アウトカム、共変量が詳細に、偏りなく、利用可能な形で収集されているか? 3. 継続的かつ一貫したデータ収集:研究対象期間中、データ収集に中断や経時的な変化がないか? 4. データが記録されている期間とデータが更新されるまでの時間:患者の平均追跡期間、曝露からアウトカム 発生を補足するまでのデータ収集期間は十分か? Hall GC et al. Pharmacoepidemiol Drug Saf. 2012;21(1):1-10. 55

56.

目的に適ったデータベースの選択 (PRINCIPLED Step 2b)  FDA Sentinel Innovation Centerが開発した因果推論研究のフレームワーク (PRINCIPLED)  リアルワールドデータを用いた観察研究において、信頼性が高く再現可能なエビデンスを創出することを目 的に、①観察研究デザインおよび②データ解析における重要な選択肢を体系的に検討するための5段階のプ ロセスを提案  Step 2bのプロセスにおいて、目的に適ったデータソースの特定するための手順を提示 Desai RJ et al. BMJ. 2024;384:e076460. 56

57.

目的に適ったデータベースの選択 (PRINCIPLED Step 2b) Desai RJ et al. BMJ. 2024;384:e076460. 57

58.

目的に適ったデータベースの選択 (PRINCIPLED Step 2b) データの該当性 (relevance) と信頼性 (reliability) の両方の基準を満たすデータソースを、関心の ある研究課題の目的に適っているとみなす データの該当性評価  質問1:適格基準は十分な精度で模倣できるか?  質問2:関心のあるアウトカムは十分な質で測定されているか?  質問3:治療は十分な質で測定されているか?  質問4:主要な交絡変数は記録されているか? データの信頼性評価  正確性 (accuracy):記録されたデータが妥当か?  完全性 (completeness):診断、検査結果、薬物治療記録を含むさまざまなデータが完全か?  由来 (provenance):ソースデータ内で記録された情報の起源を説明できるか?  追跡可能性 (traceability):解析データセットとソースデータの関係を明確に特定できるか? Desai RJ et al. BMJ. 2024;384:e076460. 58

59.

目的に適ったデータベースの選択 (PRINCIPLED Step 2b) データの該当性評価の例  質問1:適格基準は十分な精度で模倣できるか? → Yes (バリデーション研究で、2型糖尿病のPPVは96%)  質問2:関心のあるアウトカムは十分な質で測定されているか? → Yes (バリデーション研究で、性器感染症のPPVは90%)  質問3:治療は十分な質で測定されているか? → Yes (SGLT2iとDPP4iはメディケアパートDのレセプトから入手可)  質問4:主要な交絡変数は記録されているか? → Yes (人口統計学的特性、併存疾患、他の糖尿病治療) → No (HbA1c検査結果がレセプトからは取得不可) → EHRとのリンケージや未測定交絡に対する感度解析により、Yesに Desai RJ et al. BMJ. 2024;384:e076460. 59

60.

医科レセプト DPCレセプト 調剤レセプト レセプト管理レコード (MN) レセプト管理レコード (MN) レセプト管理レコード (MN) 医療機関情報レコード (IR) 医療機関情報レコード (IR) 薬局情報レコード (YK) レセプト共通レコード (RE) レセプト共通レコード (RE) レセプト共通レコード (RE) 保険者レコード (HO) 保険者レコード (HO) 保険者レコード (HO) 公費レコード (KO) 公費レコード (KO) 公費レコード (KO) 傷病名レコード (SY) 傷病名レコード (SY) 処方基本レコード (SH) 医薬品レコード (IY) 医薬品レコード (IY) 調剤情報レコード (CZ) 診療行為レコード (SI) 診療行為レコード (SI) 医薬品レコード (IY) 特定器材レコード (TO) 特定器材レコード (TO) 特定器材レコード (TO) コメントレコード (CO) コメントレコード (CO) コメントレコード (CO) 日計表レコード (NI) 日計表レコード (NI) 摘要欄レコード (TK) 症状群記レコード (SJ) 症状群記レコード (SJ) 基本料・薬学管理料レコード (KI) 臓器提供医療機関情報レコード (TI) 臓器提供医療機関情報レコード (TI) 分割技術料レコード (ST) データの信頼性評価の例     正確性 (accuracy) 完全性 (completeness) 由来 (provenance) 追跡可能性 (traceability) テーブルデータから生レセ プトの各種レコードに遡る 臓器提供者レセプト情報レコード (TR) 臓器提供者レセプト情報レコード (TR) 臓器提供者請求情報レコード (TS) 臓器提供者請求情報レコード (TS) 包括評価対象外理由レコード(GR) 包括評価対象外理由レコード(GR) 診断群分類レコード(BU) 傷病レコード(SB) 患者基礎レコード (KK) 深澤俊貴. レセプトデータの 診療関連レコード (SK) 外泊レコード (GA) 構造と管理. 包括評価レコード (HH) https://www.docswell.com 合計調整レコード (GT) /s/toshikifukasawa/5J4QQ 診療行為レコード (SI) J-2024-12-03-204653 コーディングレコード (CD) テーブル名 情報源 レセプト RE, HO, BU 傷病 SY, SB, BU 医薬品 IY, CZ, SH, CD (IYとCDの重複分は削除*) 診療行為 SI, CD (SIとCDの重複分は削除*) IR *特定入院期間 (診断群分類ごとに定められている算定期間) を超える場合 60

61.

アウトライン 1 日本の医療保険制度と医療情報データベース 2 医療情報データベースの構造と利用上の留意点 (レセプトデータを中心に) 3 研究事例 61

62.

研究事例  骨粗鬆症を併存する維持透析患者を対象に、デノスマブと経口ビスホスホネート製剤の心血管安全性および 骨折予防効果を比較した観察研究  DeSCヘルスケア株式会社が提供するレセプトデータを使用し、2014年4月1日–2022年10月31日までのデー タが解析対象 ○ 組合管掌健康保険、国民健康保険、後期高齢者医療制度の保険者からデータを取得  本論文のMethods EditorはMiguel Hernán教授 (target trial emulationの提唱者) Masuda S et al. Ann Intern Med. 2025;178(2):167-176. 62

63.

研究着想の背景  骨粗鬆症治療の第一選択薬はビスホスホネート製剤だが、腎排泄のためCKD患者に使いにくい。ただし、透 析患者は腎機能が廃絶しているので関係ない?  デノスマブは数ある骨粗鬆症治療薬のなかで、腎機能に関わらず使用できる貴重な薬剤。一方、低Ca血症の モニタリングが重要であり、心血管イベントへの影響についても十分なエビデンスが確立されていない  文献をレビューしても、透析患者を対象としたRCTは存在しない  CKD stages 3–5の患者にフォーカスしたシステマティックレビューでも明確な推奨なし Hara T et al. Cochrane Database Syst Rev. 2021;7(7):CD013424.  透析患者において、デノスマブと経口ビスホスホネート製剤による重度の低Ca血症のリスクを比較した論文 が2024年にJAMAから出ており、世界的にもトピック? (12週間累積発生率:デノスマブ群 41.1% vs. 経口ビスホスホネート製剤群 2.0%) Bird ST et al. JAMA. 2024;331(6):491-499.  日本は他国と比較して透析患者が多いので、症例数が集まりやすい?透析患者は心血管イベントも発生しや すそう 63

64.

標的試験エミュレーション (target trial emulation)  関心のある因果的な問いに答えうる仮想のプラグマティックRCT (標的試験) を、利用可能な観察データに よって明示的に模倣 (エミュレート) するアプローチ  標的試験エミュレーション、あるいはそれと理論的に等価な概念は、20世紀半ばの統計学や計量経済学に起 源を持つ  反事実理論は1986年にRobinsによって時間依存性治療 (time-varying treatments) に拡張される形で一般的 な定式化がなされ、2016年にHernánとRobinsによって観察研究のための体系的フレームワークとして提唱 Hernán MA, Robins JM. Am J Epidemiol. 2016;183(8):758-764. 64

65.

標的試験エミュレーション (target trial emulation) の手順 Step 1:関心のある因果的な問いに答えうる仮想のプラグマティックRCT (標的試験) のプロトコル の要素を特定する (point at the target) 1. 適格基準 2. 治療戦略 3. 治療割付 4. アウトカム 因果的な推定対象 (causal estimands) 5. 追跡開始と終了 6. 因果的な対比 7. 解析方法 Step 2:利用可能な観察データを用いて明示的にエミュレートする形で研究を実施する (shoot the target) 65

66.

標的試験 (target trial)  標的試験は「理想としてのRCT」であると同時に、「利用可能な観察データを用いて合理的にエ ミュレート可能な試験」  Step 1とStep 2は相互に行き来する反復的なプロセスを経て洗練されていき、「どこまで理想的 なRCTに近づけるか」と「どこまで観察データに起因する制約を許容するか」の間にある妥協点 が明確化される  このように構造化されたアプローチこそが標的試験エミュレーションの核心をなし、RCTが本来 備える望ましい特長 (因果的な問いを厳密に定義したうえで効果推定を行う枠組み) を観察研究に おいても最大限維持するための方法論的基盤となる  なお、観察データを前提とする以上、プラセボ対照や盲検化、現実には存在しない介入を設定す ることは不可能。患者のモニタリング頻度も、利用可能なデータの粒度に合わせる必要あり 66

67.

適格基準 標的試験の特定 標的試験のエミュレーション 選択基準: 選択基準: (1) 2015年4月1日–2021年10月31日の間に、日本国内 (1)–(2) 標的試験と同じ で骨粗鬆症と診断された50歳以上の患者 (2) 90日以上の維持透析歴あり 除外基準: (1) 追跡開始以前に悪性腫瘍、骨巨細胞腫、または骨 パジェット病の既往あり (2) 追跡開始以前に腎移植の既往あり (3) 追跡開始の前日までにデノスマブまたは経口・静 注ビスホスホネート製剤の使用歴あり (4) 追跡開始日にデノスマブと経口ビスホスホネート 製剤の使用あり (5) 追跡開始以前の90日間に急性心筋梗塞、脳卒中、 または心不全で入院あり 除外基準: (1)–(3) 標的試験と同じ (データベース内で遡及可能な 限りの期間において判定) (4)–(5) 標的試験と同じ (6) 追跡開始以前のデータベースへの登録期間が365日 未満の患者 67

68.

治療戦略 標的試験の特定 標的試験のエミュレーション (1) デノスマブ60 mgの皮下投与の開始 (2) 経口ビスホスホネート製剤の開始 治療期間の決定は、臨床医の裁量に委ねる 標的試験と同じ  本研究では、時間固定治療 (time-fixed treatments) のみを扱った  時間依存性治療 (time-varying treatments) のエミュレーションは、治療戦略の静的・動的の別を問わず、 時間経過に伴う治療アドヒアランスの変動に対処しなければならないため、複雑  ランダム化後の共変量が割付後の治療の影響を受ける場合 (多くの状況でこの可能性は否定できないはず)、 治療・交絡変数フィードバック (treatment-confounder feedback) を調整するために、g-methodsが必要  治療アドヒアランスに関連する時間依存性交絡変数の詳細な情報が得られない場合、g-methodsを用いたと しても時間依存性治療を含む標的試験の妥当なエミュレーションは困難 68

69.

治療戦略の種類  時間固定治療 (time-fixed treatments): 一時的介入 (point interventions) とも呼ばれる。単回のワクチン接種のように、研究期間内の単一時点で実 施される介入  時間依存性治療 (time-varying treatments): 持続的治療戦略 (sustained treatment strategies) とも呼ばれる。薬剤の定期的服用のように、時間経過に 伴う複数回の連続的介入 ○ 静的治療戦略 (static treatment strategies): - 治療開始後の個人の臨床経過に関わらず、対象集団全体に対して一律に適用される治療方針 (例:治 療継続、治療非実施、一定期間のみ治療実施など) - 「治療開始以降の副作用発現後も治療を継続する」といった非現実的な設定を含む ○ 動的治療戦略 (dynamic treatment strategies): - 治療開始後に時間とともに変化する個人の特性や臨床経過に応じて治療内容を変更する治療方針で あり、臨床実践により即した設定 - 例えば、「副作用発現時には治療中止、それ以外は継続」という治療戦略では、副作用のために治 療を中止した個人は、この治療戦略からの逸脱とは見なされない 69

70.

治療割付 標的試験の特定 標的試験のエミュレーション 患者は非盲検下でベースライン時にいずれかの治療戦 略にランダム割付される 患者は観察されたデータと一致する治療戦略に分類さ れ、ベースライン共変量の層内でのランダム化が想定 された  (i) 条件付き (/逐次) 交換可能性と (ii) 治療確率モデルが正しく特定されているという仮定が成り立てば、観 察研究において、標的試験のランダム化をエミュレートすることが可能  交絡調整のためのベースライン共変量として、既報や専門的知見に基づき、modified disjunctive cause criterionを満たす以下の変数を選択:人口統計学的特性、追跡開始年、骨粗鬆症の初回診断からの期間、初 回適格性 (維持透析と骨粗鬆症の両方) を満たしてからの期間、骨折歴および骨折手術歴、併存疾患の既往歴、 骨粗鬆症治療薬の使用歴、他の薬剤の使用歴、医療利用、維持透析の種類およびデータベース上の初回維持 透析からの期間  交絡変数によるベースラインの不均衡を調整するために、逆確率重み付け (inverse probability weighting) を適用 70

71.

アウトカム 標的試験の特定 標的試験のエミュレーション 安全性のアウトカム: 安全性のアウトカム: MACE (急性心筋梗塞、脳卒中、入院を伴う心不全、ま 標的試験と同じ (診断コードと医薬品または診療行為 たは心血管死) コードの組み合わせにより操作的に定義) 有効性のアウトカム: 骨折 (椎体、股関節、骨盤、大腿、下腿、足首、肩、 前腕、手首の骨折を含む) 有効性のアウトカム: 標的試験と同じ (診断コードと診療行為コードの組み 合わせにより操作的に定義)  冠動脈疾患が心不全入院の最も一般的な原因であるため、MACEには心不全も含めた  MACEは、循環器専門医の臨床的知見に基づき、診断コードと医薬品または診療行為コードの組み合わせに よりイベント別に定義。日本でのバリデーション研究に照らし合わせると、これらの定義の陽性的中率は 100%に近いことが期待 (ただし、心血管死についてはバリデーション研究は実施されていない)  骨折は、米国のバリデーション研究を参照しつつ、整形外科専門医の臨床的知見から日本の実態に即すよう に、骨折部位の診断コードおよび特異的な診療行為コードの組み合わせによって定義し、陽性的中率は90% を超えることが期待 71

72.

追跡開始と終了 標的試験の特定 標的試験のエミュレーション 追跡は治療割付時点で開始され、関心のあるアウトカ ムの発生、追跡不能、追跡の管理的終了 (追跡開始か ら3年時点または2022年10月31日) のいずれか早い日 に終了する 標的試験と同じ (追跡不能は、データベースからの脱 落として定義) 推定対象:総合効果 (total effect)  競合イベントをそれ以降のアウトカム発生を妨げるイベントとして解釈し、競合イベントを経験した個人は アウトカム発生なしとして管理的終了まで追跡される  治療戦略からアウトカムに至るまでのすべての因果経路を捉えていると見ることが可能  集団全体が異なる治療戦略を受けた場合のアウトカム分布の比較となり、明確に定義された (well-defined) 因果効果として解釈可能  ただし、治療戦略が競合イベントを増加させる場合、アウトカムへの総合効果は保護的になりうるなど、因 果効果として明確に定義されていたとしても解釈に注意を要する Young JG et al. Stat Med. 2020;39(8):1199-1236. 72

73.

因果的な対比 標的試験の特定 標的試験のエミュレーション Intention-to-treat効果: 効果指標は、3年リスク、リスク差、リスク比 Intention-to-treat効果の観察研究におけるアナロジー (observational analog): 効果指標は、標的試験と同じ  観察研究では特定の治療戦略へ実際に割り付けているわけではないため、intention-to-treat効果自体をエ ミュレートできることは稀  代わりに、intention-to-treat効果の観察研究におけるアナロジー (observational analog) として、「異なる 治療戦略を開始すること」の効果が定義される 73

74.

因果的な対比の種類  Intention-to-treat効果: 治療戦略への割り付け効果であり、実際の治療アドヒアランスとは無関係に定義される ○ Intention-to-treat効果の観察研究におけるアナロジー: 「異なる治療戦略を開始すること」の効果が定義され、治療アドヒアランスを問わない点で、 intention-to-treat効果の概念的特性を継承  Per-protocol効果: 割り付けられた治療戦略を遵守した場合の効果 ○ Per-protocol効果の観察研究におけるアナロジー: 開始された治療戦略を遵守した場合の効果 74

75.

解析方法 標的試験の特定 標的試験のエミュレーション Intention-to-treat解析: 絶対リスク (3年累積発生率) に基づく生存時間分布の 比較 Intention-to-treat解析: 標的試験と同じ  上記の手法であれば、ハザード比が追跡期間全体を通じて一定であるという仮定を要さず、また因果的な解 釈も可能な妥当な対比になる ○ ハザード比の問題1:時間依存的に変化する 研究で報告される単一の「平均」ハザード比は、各時点でのハザード比の時点を通した加重平均にすぎ ず、追跡期間の設定や (本来興味の対象外である) 打ち切り時間分布によって異なる値をとりうる ○ ハザード比の問題2:ハザードに内在する選択バイアスが構造的に組み込まれている (built-in selection bias) 時点tにおけるハザード比は、時点t − 1まで生存した条件付き集団での比較となるため、治療がアウト カムに効果を持つ場合、治療初期にイベントを経験しやすい対象者が選択的に除外されることで、治療 群ごとのハザードには選択バイアスが生じ (depletion of susceptibles)、因果的な解釈が難しくなる 75

76.

結果 デノスマブは経口ビスホスホネート製剤に比して、心血管リスクを増加、骨折リスクを低下させる可能性  MACE:3年リスク差 8.2% (95% CI, –0.2% to 16.7%)、3年リスク比 1.36 (95% CI, 0.99 to 1.87)  骨折:3年リスク差 –5.3% (95% CI, –11.3% to –0.6%)、3年リスク比 0.55 (95% CI, 0.28 to 0.93) 76

77.

社会的インパクト 77

78.

「標的試験エミュレーション」の日本語総説  日本で標的試験エミュレーションを普及させるべく、日本薬剤疫学会の学会誌『薬剤疫学』にて、 「標的試験エミュレーション:観察研究における因果推論の新たなパラダイム」の特集を企画 ○ 30巻2号:深澤俊貴, 篠崎智大「標的試験エミュレーション:観察研究における因果推論を強化 するためのフレームワーク」 ○ 31巻1号:深澤俊貴, 篠崎智大「標的試験エミュレーションによる不死時間への対処:逐次試験 エミュレーションとClone-Censor-Weightアプローチ」 78

79.

まとめ  医療情報データベースを扱う際は、それがいつ・どこで・どのように生み出されたものであるの か、データそのものを正しく理解する姿勢が求められる  医療情報データベースは、短期間かつ低コストで圧倒的なサンプルサイズに立脚した研究を可能 にする一方で、データそのものには様々な限界が内在していることを忘れてはならない  目前のリサーチクエスチョンがデータベース研究に適するどうかを慎重に吟味し、場合によって は一次データによる従来の前向き研究の方が好ましいと判断されることもある  医療情報データベースを用いた研究を実施する際は、その扱いに精通した専門家に相談する  適切なデータベース選択と緻密なデザイン設計のもと、有意義な研究がなされることが望まれる 79