-- Views
December 22, 24
スライド概要
動画:診療ガイドラインパネルのための学習inguide20240430_1
https://youtu.be/HVuVbxrZFmM
Y先生のEBM・診療ガイドライン講座リンク先一覧
https://note.com/mxe05064/n/n4b3ab8020899
診療ガイドラインパネル会議(パネリスト)(Ver. )
https://note.com/mxe05064/n/n25be20e1fd9c
診療ガイドラインの定義の意味を、 なぜなの?から理解し、診療ガイド ラインパネルとしての知識を学ぶ
本日のメニュー (1)診療ガイドラインの定義の意味を、なぜなの?から理解 (2)診療ガイドラインパネルとしての知識を学ぶ (3)こんなことまで考えて、推奨を決定しています
本日のメニュー (1)診療ガイドラインの定義の意味を、なぜなの?から理解 (2)診療ガイドラインパネルとしての知識を学ぶ (3)こんなことまで考えて、推奨を決定しています
世界的なHealth and Medicine Division of the National Academies(旧IOM)による診療ガイドラインの定義 診療ガイドラインは、エビデンスのシステマティックレ ビューと、複数の治療選択肢の利益と害の評価に基づいて患 者ケアを最適化するための推奨を含む文書である。
世界的なHealth and Medicine Division of the National Academies(旧IOM)による診療ガイドラインの定義 診療ガイドラインは、エビデンスのシステマティックレ ビューと、複数の治療選択肢の利益と害の評価に基づいて患 者ケアを最適化するための推奨を含む文書である。 • 診療ガイドラインは、一般のガイドラインと異なり、上記の定義に従っ た文書を示す。 • システマティックレビューとは? • 利益と害の評価とは? • 推奨とは?
システマティックレビューとは? • 系統的・客観的に、エビデンスを収集し、それを評価した 研究。 • 系統的(体系的)・客観的(かつ再現性もある)エビデンスの収集 には、検索式を用いて、事前に計画された基準に従って研究を検索 することが必要である。 • エビデンスの収集には、できれば、量的(データの数値)を統合し た解析(これをメタ分析という)が望ましいが、無理なときは、質 的な解析になる(メタ分析は、あくまでも統計的な手法を示す)。 • 従来のシステマティックレビューの定義では、メタ分析を含む場合 もあるとされていたが、近年では、メタ分析を行なっていても行 なってなくても、エビデンスの確実性を評価することが必須とされ ている。
システマティックレビューとは? • 系統的・客観的に、エビデンスを収集し、それを評価した 研究。 • 系統的(体系的)・客観的(かつ再現性もある)エビデンスの収集 には、検索式を用いて、事前に計画された基準に従って研究を検索 することが必要である。 • エビデンスの収集には、できれば、量的(データの数値)を統合し た解析(これをメタ分析という)が望ましいが、無理なときは、質 的な解析になる(メタ分析は、あくまでも統計的な手法を示す)。 • 従来のシステマティックレビューの定義では、メタ分析を含む場合 もあるとされていたが、近年では、メタ分析を行なっていても行 なってなくても、エビデンスの確実性を評価することが必須とされ ている。 • 検索式とは?。 • メタ分析とは? • エビデンスの確実性とは?
検索式とは? 検索式は、キーワードや著者名などの検索したい言葉と 「検索 タグ」 を組み合わせ、これを 「論理演算子」 でつないだもので す。 PubMedならば、MeSHという各論文の内容よりデータベース に入力されている統制語(ハッシュタグのようなもの)を利 用するなどで、再現性も確保される。 検索式は、データベースごとに異なるので、以下のサイトな どを利用して、データベースごとの検索式を作成する必要が ある。( https://sr-accelerator.com/#/polyglot ) 多くの講演会では、そんな事を行なわずに、こんな研究がありますと説明 しているのに、なぜ、系統的に検索しなくてはならないのか?を次のスラ イドで解説。
世界中の研究・論文を集めて、丁寧に系統的に検索して、 適格基準で選定したら、4論文がありました 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Tange論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) たとえば、X薬のがん治療に 4個の論文があったとする。 これを見ると、がん縮小には 効果がありそうだが、死亡 率減少の効果はなさそうな ことがわかる。
ランチョンセミナー:EBMに基づくがん治療に おけるX薬の有用性について 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Tange論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) ある高名な教授がランチョン セミナーで、 「Yuasaの研究より、X薬は がん治療に効果があった。 参考文献:Yuasa et. al. : Clinical Caries Journal 118. 2014. 30-38.」と、 英語の論文で説明した場 合、信用してしまうのではな いだろうか。 EBMに基づく: エビデンスに基づく医療に基づ く?? お薦めしない表現です!!
すなわち、エビデンスに基づくと称して、都合の良い論文の都合の良い 結果を恣意的に選んでないか? 教科書も、同様な解説の可能性がある。 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Tange論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) 都合の良い解説 写真AC
恣意的な選択をしないためには、系統的に検索を行ない、客 観的に論文を選択してから、アウトカムごとに、縦読みを行なう。 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Tange論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) 効果ありそ うですか? 効果ありそ うですか? イラストAC
恣意的な選択をしないためには、系統的に検索を行ない、客 観的に論文を選択してから、アウトカムごとに、縦読みを行なう。 表:X薬のがん治療の仮想研究例 ――――――――――――――――――――――― がん縮小 死亡率減少 ――――――――――――――――――――――― Aihara論文 効果あり 効果なし Nangou論文 効果あり 効果なし Yuasa論文 少し効果あり 少し効果あり Tange論文 効果なし 効果なし ――――――――――――――――――――――― Yuasa 論 文 : Yuasa et. al. : Clinical Cancer Journal 118. 2014. 30-38. (仮想例) 効果ありそう 効果なさそう
メタ分析とは? A研究の結果、新治療が50%の改善率、従来治療が30%の改善率。 B研究の結果、新治療が40%の改善率、従来治療が31%の改善率。 C研究の結果、新治療が30%の改善率、従来治療が35%の改善率。 との結果の場合、まとめると、新治療の改善率と従来治療の改善率 の差がどのようになるかを、統計学的に計算したもの。 • なぜ、新治療が勝っているのが2研究で多かったとか、改善率を単純に 平均したものではなく、統計学的に計算(これをメタ分析と言う)しな くてはならないかを、次のスライドで解説。
論文1の結果(A治療のが高い)と、 論文2の結果(A治療のが高い)、あわせると、 A治療とB治療のどちらが、改善率が高いですか? A治療に思えますよね? 論文1 症例数 改善数 % 論文2 症例数 改善数 % A治療 160 48 30 A治療 40 24 60 B治療 20 4 20 B治療 80 40 50
ただ単にあわせると、結果が逆転することがある! 論文1 症例数 改善数 % 論文2 症例数 改善数 % A治療 160 48 30 A治療 40 24 60 B治療 20 4 20 B治療 80 40 50 統合 症例数 改善数 % A治療 200 72 36 B治療 100 44 44 このようなシンプソンのパラドックスにならないように、 症例数と改善数で調整する統計計算(荷重平均みたいなイメージ)を メタ分析と言う。
よって、メタ分析という統計手法で計算する必要がある 研究名 がんの抑制効果 Tange1) 1/20 vs 10/20 RR=0.10 効果なし Yuasa2) 28/45 vs 20/55 RR=1.71 少し効果 Nangou3) 15/55 vs 5/65 RR=3.55 効果あり Aihara4) 9/32 vs 3/38 効果あり Kousei5) 相対危険度 RR=3.56 記載なし 1.62 メタ分析・ meta analysis
エビデンスの確実性とは? 特定の集団における特定のアウトカムへの介入の効果推定値 における確信性または確実性のレベルを記述する必要がある。 従来のエビデンスの確実性の用語の変遷(実は、最初のエビデンスのレベルの頃より、 現在のエビデンスの確実性の評価方法のコンセプトはあったが、全く誤解されて使われ ていたので、現在、エビデンスレベルと表現すると、分かってないな~になる)。 2014年までのMindsの資料 :エビデンスレベル 2018年までのコクランレビュー :エビデンスの質 2019年までのMindsの資料 :エビデンスの強さ 2019年からのコクランレビュー 2020年よりのMinds :エビデンスの確実性 次のスライドから、その必要性と、現在の評価方法を簡単に解説。
各論文が、丁寧か、いい加減か、を調べて見たら・・・ 研究名 がんの抑制効果 Tange1) 1/20 vs 10/20 RR=0.10 効果なし Yuasa2) 28/45 vs 20/55 RR=1.71 少し効果 Nangou3) 15/55 vs 5/65 RR=3.55 効果あり Aihara4) 9/32 vs 3/38 効果あり 記載なし Kousei5) 丁寧に作られていた バイアスのリスクが低い 相対危険度 RR=3.56 いい加減に作られていた バイアスのリスクが高い 1.62 この値の確実性は、 高いですか・低いですか
各論文が、丁寧か、いい加減か、を調べて見たら・・・ 研究名 がんの抑制効果 Tange1) 1/20 vs 10/20 RR=0.10 効果なし Yuasa2) 28/45 vs 20/55 RR=1.71 少し効果 Nangou3) 15/55 vs 5/65 RR=3.55 効果あり Aihara4) 9/32 vs 3/38 効果あり Kousei5) 丁寧に作られていた バイアスのリスクが低い 相対危険度 RR=3.56 記載なし いい加減に作られていた バイアスのリスクが高い 1.62 この値の確実性は、低い
もし、各研究の結果のバラツキが、以下のようだったら? Tange1) Tange1) Yuasa2) Nangou3) Yuasa2) Aihara4) Nangou3) Aihara4) 0.0 0.0 メタ分析:1.62 メタ分析:1.62 同じ1.62でも、右と、左では、 どちらが、確実性が高いでしょうか?
もし、各研究の結果のバラツキが、以下のようだったら? Tange1) Tange1) Yuasa2) Nangou3) Yuasa2) Aihara4) 0.0 メタ分析:1.62 同じ1.62でも、確実性が低い Nangou3) Aihara4) 0.0 メタ分析:1.62 同じ1.62でも、確実性が高い
このような確実性を下げる要因をまとめると5つある 研究の限界 (limitation, risk of bias) 非一貫性 (inconsistency) もし、そのアウトカムの結果を構成する、いろい ろな論文にバイアスが多く存在していたら・・・、 もし、論文間で、結果が異なっていれば・・・、 非直接性 もし、最初に想定した臨床の疑問の患者層と、選 択した論文の患者層が異なっていれば・・・、 不精確さ もし、症例数の小さな、あまり精確でないデータ を、メタ分析と称して、集めて有意差がでただけ だったら・・・、 (indirectness) (imprecision) 出版バイアス (publication_bias) もし、有意差がなかったからと報告されなかった 論文や、都合が悪いので論文に書かなかったアウ トカムが、たくさんありそうな状況だった ら・・・、
このエビデンスの確実性を客観的に評価する方法論を、GRADE アプローチとよび、WHOなど世界中で使われている
すなわち、メタ分析の値のみが一人歩きすると、間違った解 釈が行なわれる可能性がある 相対危険度 1.62
よって、システマティックレビューのメタ分析の結果は、数字に必ず確 実性という紐をつけておく(これが世界の主流になってきているが、ま だ、行なってない先生も多い) 確実性の程度 相対危険度 1.62
ちょっと待った! しかし・・・、確実性が高く、値も効果があったとしても・・・ 確実性:高い 効果あり しかし、害などがあれば・・・
利益と害の評価とは? • 利益のエビデンスだけでなく、害(望ましくない効果)も検討し て、利益と害のバランスを評価する。 • 害だけでなく、コストや価値観など、その他の要因も考慮して評 価する必要がある。 害 コスト 利益 患者価値 確実性
推奨とは? • 臨床疑問、エビデンスの検索、および分析的枠組みの内の 他の情報の検討に基づいて、診療ガイドラインが推奨する 行動方針。具体的で実行可能な声明であること。 • 推奨の方向(行なう・行なわない)と、推奨の強さ(強 い・弱い)に分けて表現されることが世界標準になりつつ ある。 • 推奨の強さは、本来連続体(continuum)であるが、2つに 明確にグレーディングすることのメリットはデメリットを 上回ると考えられる。
さて、再度、定義を読んでみよう。 ふーんそうなんだでなく、納得の理解に変わったと思うが、どうでしょうか? 知っている用語で、文は 分かるし、 ふ~ん、そうなんだ、 これが大切ね、わかった わかった。 そういうことで、 この定義なん だ~! 世界的なHealth and Medicine Division of the National Academies(旧IOM)による診療ガイドラインの定義 診療ガイドラインは、エビデンスのシステマティックレ ビューと、複数の治療選択肢の利益と害の評価に基づいて患 者ケアを最適化するための推奨を含む文書である。
本日のメニュー (1)診療ガイドラインの定義の意味を、なぜなの?から理解 (2)診療ガイドラインパネルとしての知識を学ぶ (3)こんなことまで考えて、推奨を決定しています
診療ガイドラインパネリストとして必要な知識 GRADEアプローチを作成しているグループ の主要メンバーが中心に、INGUIDE: International Guideline Training and Certification Programという団体がある。 https://inguide.org/ ここからは、このコースの中の、 CERTIFIED GUIDELINE GROUP OR PANEL MEMBER に準じて解説するが、同 じ解説では、著作権に問題があるので、本 スライド作成者の視点で、公開された文書 (GIN-McMaster Guideline Development Checklist)を使っての解説になるので注意 されたい。 ともかく、知っておくべき知識が羅列して いるだけの、苦行のようなスライドが続く。 このスライドで理解 しろってか~!
信頼できるエビデンスに基づく診療ガイドラインとは? 信頼できる診療ガイドライン 信頼できない診療ガイドライン 明瞭度 明確で実用的な推奨 あいまいな推奨 パネル構成 すべての主要ステークホルダーを含む学 際的パネル パネルに関連する視点(患者など)が含まれていな い 利益相反 宣言して、適切に管理される 相反する事項の申告や管理がなされていない 重要な PICO 要素が特定されておらず、患者にとっ アウトカムの選択 患者にとって重要なアウトカムを含むPICO て重要なアウトカムよりも、委員会の懸念事項が使 と優先順位付け 形式を用いる 用されている エビデンスの要約 入手可能な最良のエビデンスを用いたシ ステマティックレビューに基づく推奨 GOBSAT;質の低いシステマティックレビュー 価値観と意向 患者の価値観や意向を明確に配慮 患者の価値観や意向を無視している 推奨の強さ エビデンスの確実性と価値観や意向の多 様性を評価し、アップサイドとダウンサ イドのトレードオフを一致させる アップサイドとダウンサイドのトレードオフ、エビ デンスの確実性の評価、および/または価値観や意 向のばらつきを無視する 裏付けとなるエビデンスは、絶対的リス 裏付けとなるエビデンスが相対リスクとして提示さ 推奨の提示と根拠 クの後に、エビデンスの確実性をユー れ、エビデ ンスの確実性がない、または不十 分に ザーフレンドリーな方法で提示(SoF表) 評価されている。 Lima JP, Tangamornsuksan W, Guyatt GH. Trustworthy evidence-based versus untrustworthy guidelines: detecting the difference. Fam Med Community Health. 2023 Oct;11(4):e002437. doi: 10.1136/fmch-2023-002437. PMID: 37802543; PMCID: PMC10565152. https://www.ncbi.nlm.nih.gov/pmc /articles/PMC10565152/
推奨の裏付けとなる情報(EtDより) 説明書類 背景情報 正当性 サブグループに関する検討事項 関連する可能性がある他の推奨 その他: 実施にかかわる検討事項 監視と評価 研究上の優先事項
診療ガイドライン作成のためのチェックリスト GIN-McMaster Guideline Development Checklist https://cebgrade.mcmaster.ca/guidecheck.html
1. 組織、予算、計画、ならびにトレーニング • 統括委員会・監視委員会:作成全体の責任を持つ。その家 庭では、作成のコーディネーターを含むことがある。作成 に対する提言を承認し、最終的な診療ガイドラインを承認 する。the guideline development groupを編成する。 • 診療ガイドラインパネル:患者や市民を含む専門知識をも つグループ。推奨を作成する。一部のパネルは統括委員会 の兼任もある。 • 医療利用者と関係者:外部・内部から意見を提供。パネル メンバーになることもある。または、臨床疑問やアウトカ ムの優先度や重要性の評価のみに参加することもある。 • ワーキンググループ(システマティックレビュー班・特定 のトピックスについての技術的な専門家):資料の作成を 行なう。 *これらすべてを、the guideline development groupとの 記載があるが、統括の所を見ると違う事になる??
2. 優先順位の設定 • 優先順位の決め方のプロセスを決めた後に、利害関係者を 組織し、既存の診療ガイドラインがないかを検索して、透 明性を確保するために、優先順位設定プロセスおよび選択 されたガイドライントピックを記録する(この優先順位と いうのは、具体的な疑問は含まれてないかもしれないが、 そこまでの記載がなくて不明である) 。 • 基本的に統括委員会が行なうので、パネルは、優先順位に ついてコンサルトすることはあるが、パネルメンバーとし ての仕事は、まだ始めてない。 *2024年に以下の資料が出版されたので参考にして欲しい Strengthening countries’ capacities to adopt and adapt evidence-based guidelines a handbook for guideline contextualization. Retrieved from https://iris.who.int/bitstream/handle/10665/372275/9789289060028-eng.pdf.
3. ガイドライン(作成)グループのメンバー構成 • これは、診療ガイドラインパネルとワーキンググループで あるが、明確にすべてを区別できない作業もあり混乱しや すい。 • ガイドライン作成グループには、対象読者の一員、患者と 介護者、現場の臨床医、当該領域の専門家、方法論的専門 家、医療経済専門家などの分野横断的な顔ぶれを揃えるこ とにより、求められている役割を果たす(例: 作業部会やガ イドラインパネルに求められる役割)。 • ガイドライングループメンバーの役割、および各メンバー の担当業務を概説する(例: 執筆チームの一員、会議の議事 録作成や決断の記録を行うグループ内の記録担当者、方法 論的コンサルティングの提供、システマティックレビュー の実施および他のエビデンスの収集、患者の視点の提示、 臨床専門医としての視点の提示など)。 • 患者もまた専門家とも言える。
パネルメンバーの責任 • ガイドラインが取り上げるべき疑問の決定 • グループ会議への参加 • エビデンスや文脈的要因(コンテキスト化・最小臨床差の 閾値など)等の基本情報の提供 • エビデンスサマリーのレビュー • 提供されたエビデンスをもとに推奨作成 • レビューと最終版のガイドライン作成 • ガイドラインの普及の支援をする • 委員会の委員は等しく発言権を持ち、会議の参加などの責 任を負う。
4. ガイドライングループプロセスの確立 • ガイドライン作成グループ向けのトレーニングの一環として、プ ロセスおよび提案されている方法は何かについて、さらにはこれ らを遵守する必要があることについて、各グループメンバーが理 解することを確実にする(例: 採用されることになる合意形成方 法、匿名または非匿名の投票、エビデンスの評価、グループディ スカッションおよびアイデアの提供)。 • 各グループメンバーに平等に貢献の機会を与え、なおかつ各メ ンバーのアイデアや見解が十分に考慮されるようにするための最 適な条件を設定することを目的とする(例: グループディスカッ ション、意思決定、推奨の定式化に際して)。 *このあたりは、パネルのみの話になるが、パネルと作成グループ のすみ分けと、ワーキンググループはSR班などだが、なぜか、ここ には、the guideline development group membersと書いてあり、 これがどれを示すのか、何度読んでもわかない。
ポイント:ガイドラインにおける意見とエビデンスの区別 診療ガイドラインにおける意見とエビデンスの間には大きな 相違があり、その区別をする必要がある。 例えば、患者が「癌の発症後10年生存している」は意見だが、 医師が「癌の100人の患者を手術したが生存している」はエビ デンスになる。しかし、医師が「手術は有効である」という ならば、それは意見となる。
5. 対象読者の特定とトピックの選択 • チェックリストでは、トピックの選択となっている。(こ れは、基本的にパネルが決めるのではなく、統括委員会が 決めると思われるため、本チェックリストでは、誰が作業 するのかが曖昧である。) • INGUIDEのパネルの知識のための資料では、「トピックの 理解」となっており、パネルは理解するだけのようだ。 • ガイドラインのプライマリオーディエンス(例: プライマリ ケア医師、医療プログラム管理者)とセカンダリオーディ エンス(例:病院管理者)を特定、定義、および/またはレ ビューし、ガイドラインで取り上げることのできるオー ディエンス(対象読者)数を理解する。
6. 消費者と利害関係者の関与 • ガイドラインの影響を受けると考えられる全ての人々の見 解を盛り込むために、ガイドラインの作成において関与と 意見交換を求めたい適切な利害関係者を特定する(例: 専門 家団体、衛生管理責任者、政策決定者、業界団体)。 ↑どうも、これは、意見を聞く関係者であり、決めるのは 統括委員会のようだ。関係者もトレーニングを受けて、投 票権を持つパネルメンバーになる事もあるらしいが、現実 的に、そこまでの責務を負う人がいるのだろうか?
7. 利益相反(COI: conflict of interest)に関する検討事項 • プロジェクト参加時の個々の参加者(実際の関与が始まる 前のガイドラインパネルメンバー候補者を含む)の利益関 係の宣言(DOI: declaration of interests)のための方針 を設定する(例: どのような利益関係を開示すべきか、専門 家団体の金銭的、知的、学術的/臨床的、競争的利益関係) • COIをもつメンバーを加えないためにあらゆる可能な努力 を払うべきである。 • 診療ガイドライン作成グループの議長には、直接的な金銭 的COIや関連する間接COIがあるべきではない。避けられ ない場合、COIを持たない共同議長を任命すること。 • 推奨の方向性や強さを判断する場合は、特に、直接的な金 銭的COIがあるべきではない。その議論に物理的に居合わ せないようにする。
8. (PICO形式の)疑問の生成 • 標準フォーマット(例: PICO)を使用することにより、ガ イドラインで解決を図ろうとしている重要な疑問の生成お よび記録を行い、全ての疑問を解決するのが可能ではない 場合には、生成した疑問の優先順位を設定するための基準 を決定する(例: ガイドラインパネルメンバーや利害関係者 を対象としたアンケート調査)。 • 適切なアウトカムに焦点を当てた回答可能なクエッチョン という観点から、診療ガイドラインを構成することが大切 です。 • Xの人において、AとBのどちらを使うべきか?(~すべき か?という疑問)⇒Xの人には、BでなくAを使うことを診 療ガイドラインパネルが推奨/提案する
クエスチョンが重要かどうかを左右する要因 1. 実施する上で一般的なクエッチョンであるか 2. 実施する上で不明瞭な状況であるか 3. 検討すべき新たなエビデンスがあるか 4. 複数の選択肢があるか 5. リソースの利用・コストへの影響があるか 6. これまで十分に検討されてこなかったか 実現可能なリストとするため、重要なクエッチョンを削減し ないようにして欲しい
クエッチョンの種類 • 背景疑問と前景疑問 • 診療ガイドラインでは、行動の指針となるため、前景疑問 が必要となります • ~すべきか?が典型的な質問である Xという対象に対してAとBのどちらを使うべきか? (Should A or B be used for people with X?) • 検査の場合は、検査のために検査をするのではないので、 その検査の結果に基づいて治療やその他の選択肢の後に起 りうるアウトカムについて考えるべきである • 以下の質問は典型的ではない(後のスライドで具体例もある) -Xの人において、介入AはBと比較して実行可能か? -X患者において、AとBを比較した場合、アウトカム1、2、 3に対してどのような影響があるか? -X患者の治療にはAとBのどちらが望ましいか?
9. アウトカムと介入の重要性、ならびに価値観、意向、効用値の検討 • アウトカムによって健康上の益と害のバランスが、関心の ある介入に有利かどうかを判断できる必要がある • 意志決定にとって重要なことが必要であり、評価されてい ることがすべて重要な訳ではない • 望ましい効果の例:死亡率の低下・入院期間の短縮・有病 期間の短縮・QOLや症状の改善 • 望ましくない効果の例:死亡率の上昇・有害事象・耐性発 現・QOLや症状の悪化 • アウトカムと介入の相対的重要性、価値観、意向、または 効用値についての情報を収集する場合や、意思決定や推奨 の定式化を行う場合に、誰の視点を考慮するかを決定する (例: 患者、一般市民、社会、臨床医)。
診断検査について(他の資料とスライド著者の考察) 診断検査の疑問について:検査の場合は、検査のために検査をするのではないので、その検査の結果に 基づいて治療やその他の選択肢の後に起りうるアウトカムについて考えるべきである。 診断検査は、2つの事を考える必要がある。1) 診断検査精度そのものの評価とエビデンスの確実性。 その診断検査がどれだけ精確かどうかについて(一つの検査だけか、2つの検査の比較かは問わず)、 2) 診断検査を行なったら、行なわないに比べて、(または、A検査を行なったらB検査を行なったの と比べて)、予後や死亡率などの患者にとって重要なアウトカムが改善するかという検査の影響とエビ デンスの確実性。現実には、2)のデータはほとんど無い。さらには、その時行なった治療効果のエビ デンスの確実性も考慮しなければならない。 さらに議論をややこしくするのに、堀田信之先生の著書によると、診断精度研究では、a) one-gate designの研究をコホート研究(例:D-dimerを測定された100人を評価する研究)、b) two-gate designの研究をケースコントロール研究(CTで肺塞栓ありの15人となしの80人を集める)と呼び、時 の概念のない診断精度の研究でもコホート研究という用語を使うらしい。 また、推論も2つ存在する。i) 新しい検査群と対照検査群にランダム割付けし、患者にとって重要なア ウトカムを評価する、検査―治療ランダム化比較試験を、one step inference approachと呼ぶ。ii) 患者は新しい検査と参照検査の両方を受ける。次に、研究者らは、参照検査と比べた場合の新しい検査 の診断精度(真陽性など)を算定する。新しい検査の陽性者は、治療あり、または治療なしに割付けら れる(または、過去の研究で割付けすみ)。次に、研究者らは、両群について患者にとって重要なアウ トカムを評価し比較する。これを、two step inference approachと呼ぶ。しかし、実際には、このよ うな研究もほとんど存在せず、上の、1)の研究しかなかったとか、単なるコホート研究において、予 後良好群と不良群において、事前の診断検査として、陽性だったか陰性だったかを後ろ向きで解析した だけの研究しかなかったという事が多い。 しかし、診療ガイドラインにおいて、診断検査の臨床の疑問は、2)の「A検査に対してB検査を行なう べきか(患者にとって重要なアウトカム)」が基本となる(その中に、1)のいろいろな診断検査精度 のメタ分析がはいってくる構造)。
アウトカム評価への取り組み • アウトカムは7つ以下が望ましい • 意志決定において重大、重大でないが重要、重要ではない を、1-9の評価尺度を使用して示す • 同じ重大でも、例えば、7の肺炎と9の死亡では、効用値が 異なる • アウトカムは重要性によって決定されるべきであり、利 用・測定可能かとかシステマティックレビューに記載があ るとか、ランダム化比較試験のプライマリーアウトカムで あるとかによって決定されるべきではない • 代替のものも含め意志決定のためにすべてのアウトカムを 考慮する
10. 採用するエビデンスの決定、ならびにエビデンスの検索 • 健康影響の大きさは、エビデンスの確実性とともに評価する • エビデンスの確実性とは、 GRADEアプローチを用いて評価し、 パネルがつける優先順位ではないし、インパクトファクターは関 係ない • エビデンスの確実性は、関連や効果の推定値が特定の意志決定や 推奨を支持するために正しいか、適切かどうかの確実性である • エビデンスの確実性は、真の効果が指定された閾値の片方、また は選択された範囲内にあることの確実性と考えるのが適切である • システマティックレビューは、特定のリサーチクエッチョンに答 えるために、あらかじめ指定された適格条件に適合するすべての 実証的エビデンスを照合することを試みる科学的研究である。そ して、バイアスやランダムエラーを最小化にするために、明示的、 体系的、再現可能は方法を使用する • システマティックレビューを用いることで、効率的かつ効果的に body of evidenceを評価することができる
• メタ分析は、含まれる研究の量的な統合であり、システマ ティックレビューとの定義が異なることを理解する • メタ分析での研究の重みはその研究がプールされた全体的 な結果にどれだけ貢献したかを示す • ネットワークメタ分析は、対照に対して複数の介入を同時 に評価してメタ分析を行なう方法である • メタ分析は、研究レベルのデータだけでなく、患者からの 実データによって分析する、個別被験者データのメタ分析 もあるので注意されたい • メタ分析の結果は、フォレストプロットで視覚的に評価す ることも重要であり、SoF表は、結果を利用しやすい、ま た、それぞれの読み方を知る必要がある(読み方のスライ ドが少しあったが割愛) • イベントがない場合はフォレストプロットに含めない(基 本は、その通りだが、あえて含めているのも多いようだ)
• バイアスのリスクは、結果に影響を与えるかどうかを評価していくことが重要であ り、“Limitations in the study design or execution” でもある • 非一貫性は、研究間で一貫しているかを評価するが、 まず天水屮がどれだけ近い かを評価した後に、信頼区間や、カイ二乗検定やI2などの統計量を使うが、たとえ ばI2のみをみて判断することではない • 非直接性は、我々のクエッチョンとどのように直接関係しているかをPICOを考えて 評価する • 不精確さは、効果推定値が精確か、ランダムエラーによるものかなどを、95%信頼 区間などを利用して評価するが、ポイントは個々の研究ではなくようやく推定値 (相対効果でなく絶対効果を用いる)に対して評価されることである • 出版バイアスは、いろいろな理由で隠された研究があるかを示す • その他、何か確信が持てる要素(大きな効果、最悪の場合の予測因子の強い結論、 用量反応勾配)があるか *グレードダウンについて、この程度の記載だったが、これで分かるのだろうか?? • すべてのパネルメンバーが同じアウトカムの定義で評価し、意味するところを理解 し、暗黙の考慮事項を明示しなければならなく、健康とその文脈を考えなければな らない
13. 推奨の作成、ならびに推奨の強さの決定 • ガイドラインパネルの主な目的は、対象ユーザーにとって 具体的で、実用的で、理解しやすいレコメンデーションを 生成することである • コンセンサスや投票の正式なルールは、ガイドライン作成 プロセスが始まる前に計画すべである • ガイドラインの周知・実施は、すべてのパネルメンバーを 積極的に参加させることができる • 推奨:介入を行う事に強く反対する推奨・介入を行う事に 反対する条件付き推奨・介入を行う事または比較対照への 条件付き推奨・介入を行う事に対する条件付き推奨・介入 を行う事に対する強う推奨、の種類がある • 多くの推奨は、個々の状況に応じて“条件付き”となる
• 推奨には、誰が推奨しているか、推奨の強さ、エビデンスの確実 性が含まれ、実行可能な推奨事項が実際に採用されていることを 目的としています • 推奨:ある特定の状況について最善の策を提案する文書 • 対象、介入、比較対照についての説明を含むべきである • 推奨の強さ、根拠となるエビデンスの確実性を含むべきである • エビデンスに基づく推奨を決定するために2つの主は意志決定は、 どのような方向で推奨を作成すべきか、推奨はどの程度の強さに すべきか • 強い推奨:すべての基準が選択肢を推奨する方向を示している (明確な正味の健康への益・重要でない価値観の違い・高額でな いこと・公平性、容認性、実行可能性への懸念がない) • 条件付き・弱い推奨:正味の結果をもたらすかどうかの確信度が 低い場合である
• 推奨の方向性や強さに基準が与える影響について 問題・価値観や意向、またはアウトカムの重要性(不確実 性がないこと)・エビデンスの確実性・益と害や負担と、 それらのバランス・資源による影響・公平性・容認性・実 行可能性が、それぞれ、高いほど強い推奨となる可能性が 高い • 推奨を作成する際に、ガイドライン作成グループは介入ま たはその代替え案を推奨または提案する(INGUIDEには、 When making a recommendation, a guideline group will recommend or suggest an intervention or the alternative.との記載であったが、正直、唐突にでてきて、 意味不明。作成グループが、どのグループを指すのかも不 明。その後に、要するに・・・として、上の基準が与える影響 とほぼ同じ文章が並んでいて、何も解説になってない状況 で、わからんな~)
• Evidence-to-Decisionフレームワークは、意思決定の透明 性を高める • 結果のバランスは、健康への影響のみに基づいて決定され るのではない • 益と害のバランスは、介入を支持するのか、しないのかと 考えて判断する • その場合、各アウトカムの意志決定(=推奨の作成)に対 する相対的重要性を1~9点で評価して後に、3つに分類す る。 • 各パネルが評価した点数の平均値から判断することがある (本来ならば、効用値まで考えるが、とりあえずパネリス トのアンケートによることもあるということ)
• 推奨を作成するためには、「リソースの利用・費用対効果・健康 の公平性・容認性・実行可能性」など、文脈的要素への影響を理 解することが必要である • 望ましい効果と望ましくない効果のバランスが明確でない場合、 条件付き推奨となる(推奨なしを安易に選ばないこと) • 強力な推奨事項の意味の 1 つは、ほとんどの状況で推奨事項を ポリシーとして採用できることです • 条件付き推奨の意味は、「多くの人は、推奨される一連の行動を 望まないでしょう・個人には、価値観や好みに応じて、さまざま な選択肢が適しています・政策立案者には、様々なステークホル ダーとの充実した議論が必要である・さらなる研究により、推奨 事項が強化される可能性があります」を含む • 条件付き推奨は、患者にとって、その状況下にある人の多くが提 案される行動を希望するが、希望しない人も多いという状況であ り、多くの場合、実施に際して十分なサポートを必要とする
• バランスの判断が難しい場合 • • • • • EtDの基準に関するリサーチエビデンスが決定的でないため、正味の効果が不明 確である(確実性が低い、非常に低い、特定の対象者に対して効果があまりに も異なる) 効果が非常に緊密に拮抗しているか、利益の大きさは害と同程度である 個人によってアウトカムの価値観が異なるため、すべての人に推奨を適用する ことは適切でない 法的管轄区域によってコストが異なるが、高すぎる 介入や効果が公平でなかったり、実行不可能である • 推奨は、エビデンスの確実性がどれであっても、まずパネル内でコンセ ンサスが求められる • コンセンサスが得られない場合は、投票プロセスを使用して、推奨事項 の方向性と強さを決定(結論の提案に反対の意見がある場合に投票とあ るので、この時点で推奨文の草案があるとはず)となり、EtD frameworkの基準については、単純多数決で決定する • 方向性が明確な場合、共同議長や議長がはじめに推奨が介入に対して賛 成か反対かを提案する(the strength will need to be determined・ ここでカッコ内として強さは決定する必要があるとあり、そうすると、 明確なときは方向はパネルで決定せず、自明の理として議長が提案し、 強さのみ決定するということのようである・・・変な文章だ)
• 単純な多数決のルールは、勧告の方向性(賛成または反対)を決定する場合、 パネルが利益相反のある個人で大半を占める場合、個々の証拠から判断ま での枠組みの基準について判断する場合に使われるが、強い提言を検討す る場合は、80-90%の賛同が必要となる • 推奨事項に貢献した主な考慮事項を説明すると、「コンテキストを説明す る、推奨事項を正当化する、ターゲットオーディエンスに透明性を提供す る」ができる • ガイドラインの適応(Adaptation)には、限られたリソースのアカウン ティング(会計報告)、患者の価値観や意向が異なることを想定する、別 の言語への翻訳が含まれる • グッドプラクティスステートメントは、最初から明確なメッセージを表し、 完全に構造化された評価はパネルの時間の使い方として不適切であるので、 効率を考えるために提示する(すいません意味不明な文章ですが、こんな 感じ)(5つの条件) 1. メッセージは明確で、実施しやすいか 2. 実践的な医療慣行に必要なメッセージであること 3. 関連するすべてのアウトカムと潜在的な起こりえる下流効果を考慮した結果、GPS とするに基づき実践摺ることは大きなプラスの効果がある 4. エビデンスの収集と要約が、作成委員の時間と労力の有効活用にならない 5. 間接的なエビデンスをヌスビつける十分な文章かされた根拠がある
• ガイドラインのピアレビューが、他の視点からの修正のた め奨励されている • 診療ガイドラインは、利用者からのフィードバックを収集 することで、ガイドラインの将来のバージョンで改善すべ き領域を特定する • ガイドラインを更新するための計画で、他の組織は同じト ピックのガイドラインを更新していることは考慮しない
• INGUIDEのスライドよりポイントとして 「推奨なし」は存在しない • • 目的は臨床医に指針を与えることである パネルが推奨を作成するのに最も適した立場にある • 一人の専門家では、すべてのエビデンスを検証することができない • このINGUIDEの作成者のシェネーマン先生は、「推奨なし」を否定し ている。エビデンスが不十分であって、専門医一人で判断するより、ガ イドラインパネルの方が、推奨を作成し行動方針を提案するのに適して いるのだから、推奨しましょうという考えのようだ • 間違った推奨の表現方法について 低分子量ヘパリンはプラセボと比較 すると血栓塞栓症を減少させる これは推奨でなく、事実の記載、実行可能な 記述が必要 低分子量ヘパリンの使用が検討され ることを提案する 検討でなく、方向性と強さが示されるべき YよりXを使う方が良い 行動への示唆が欠けている 入院患者には低分子量ヘパリンを使 用するのが標準的なやり方である 推奨は、標準的な実施を説明するのではなく、 何が最善であるか否かを説明する
15. 報告とピアレビュー • 診療ガイドラインの執筆は、ガイドライン委員長または執筆委員 会( ガイドライン制作物の執筆を担当する責任者(例: ガイドラ イン作業部会の小委員会)、ならびに著者資格(例: 個々の著者、 著者としての組織、著者としての作業部会)を決定しておくと良 い) • 通常、パネルメンバー全員が診療ガイドラインの共著者になりま す、また、エビデンスレビューを実施したものや、その他の実質 的貢献者は共著者とされます • パネルメンバーは、ガイドライン作成に参加するが、少なくとも 最終版を確認しフィードバックを行ない、最終版を承認すること が役割になる • ガイドラインを報告するための特定の構造、見出し、内容を備え た標準化されたフォーマットを作成または採用する • 推奨の正確さ、実用性、明確性、構成、有用性を確認するために 最終文書をレビューすること、ならびにガイドライングループで は網羅し切れなかったより広範かつ重要な視点を確実に取り入れ ることを目的とした、外部専門家によるピアレビューの方法を決 定する
16. 配布と実行(実装) • 利用と著作権を考慮しつつ、ガイドラインの採用を促すための 様々なアプローチを盛り込んだ積極的配布計画を立案する(例: オンラインでのガイドライン提供、ガイドラインの配布と実行に 責任を持つ医療システム関係者との正式な関係の構築によるガイ ドライン受け入れの促進、記者会見、ソーシャルメディア戦略、 専門家団体の集まりでの配布、対象読者がアクセスする学術誌で のガイドライン掲載) • 推奨を診療に活かす方法についての指針を提供するツール、サ ポート、派生製品を開発または改変する(例: モバイルアプリ ケーション、臨床決断支援システムへの組み込み、対象読者向け の教育支援のための教育資源としても改変可能なガイドライン)。 • ガイドラインの改変について検討し、他の状況にガイドラインを 改変したい対象エンドユーザーがどうすれば系統的かつ透明性の 高い方法でそれを実現できるかについて、具体的な指示を提供す る • ガイドラインを他言語に翻訳するためのルールと規定を定める
17. 評価と使用 • 対象エンドユーザーを対象に、ガイドラインのパイロット テストを実施することを検討する • 対象エンドユーザーがガイドラインの推奨の実行および使 用を監視・監査するための基準とツールを提供する(例、 ガイドラインの実行によって変化すると考えられているア ウトカムを特定し、それらのアウトカムを測定する方法を 提案する) • ガイドライン実行後の効果を判断するための前向き評価の 実施に向けたサポートとツールを提供する
本日のメニュー (1)診療ガイドラインの定義の意味を、なぜなの?から理解 (2)診療ガイドラインパネルとしての知識を学ぶ (3)こんなことまで考えて、推奨を決定しています
(3)こんなことまで考えて、推奨を決定しています 1. 診療ガイドラインの作成の効率化のため、既存の診療ガイドラインやシステ マティックレビューを活用すること 2. 診療ガイドラインには、正式な推奨文以外に記載されることがあります 3. メタ分析の結果のフォレストプロットの読み方 4. エビデンスプロファイルとSoF表とは 5. Evidence to Decision framework(EtD表)とは 6. 推奨の決定は、 EtD表から、何となく、こうだよね~で決めるのではない
1.診療ガイドラインの作成の効率化のため、既存の診療ガイドラインやシス テマティックレビューを活用すること この方法を、GRADE-ADOLOPMENTと言い、診療ガイドライン作成を効率化し、迅速に作成するために必須 の要件となっている。 たとえば、既存のSRで、作成方法が適切で、CQにしっかりと一致してるものがあれば、それを使おうという こと。よって、作成方法が適切かどうかをチェックするための指標を利用することが必須となる。
2.診療ガイドラインには、正式な推奨文以外に記載されることがあります Lotfi T , Hajizadeh A , Moja L , Schünemann et al . A taxonomy and framework for identifying and developing actionable statements in guidelines suggests avoiding informal recommendations. J Clin Epidemiol 2022;141:161– 71.doi:10.1016/j.jclinepi.2021.09.028 pmid:http://www.ncbi.nlm.nih.gov/pubmed/34562579 これまで、以下のような診療ガイドラインには推奨や声明があるが、それをWHOの文書を使って分類し直した。 ガイドラインと推奨事項 ガイドラインの推奨事項は、特定の状況や問題に対する潜在的な解決策から最善の選択肢を選び、望ましい結果を最 適化するための明確な行動指針です。これらの推奨事項は、対象となる人口、介入、比較対象など、その推奨事項が 対処しようとしている問題の要素を含みます。正式な推奨事項は、最善の利用可能な証拠に基づいており、信頼でき て透明性のある方法と基準に従って開発されます。これらの方法には、証拠の確実性の体系的かつ透明な考慮、ガイ ドライン開発グループの明確な判断に基づく推奨事項の強度の決定などが含まれます。 その他の声明 しかし、ガイドラインはしばしば推奨事項以外の声明も含みます。これらは推奨事項の形や行動指針性を持つかもし れませんが、完全な開発プロセスを経ていない場合があります。例えば、「良い実践の声明(GPS)」は、その開発 のための証拠の確実性に対する正式な評価が適切でないとガイドラインパネルが判断したときに発行されます。GPS を発行する理由は多岐にわたりますが、それは一般的に、回答が明らかであるという事実に根ざしています。 実装に関する配慮 推奨事項は、臨床ケア、公衆衛生、健康政策の実装に関連する必要な微細な点を提供する上で限界があることもあり ます。例えば、薬の投与量を指定しない、または実験室のテストを行う方法について必要な技術的詳細を指定しない 場合があります。「実装の考慮事項」、「ツール」、「ヒント」は、パネルが発行する別のタイプの行動指針的な声 明を表します。これらは通常、実践における正式な推奨事項の使用を支援するための追加情報を提供する説明文で構 成されます。
具体例: 推奨事項 (Recommendation):外科的結核の診断に関する推奨事項。 外科的結核の兆候と症状がある成人と子供に対しては、リファンピシン耐性の検出のために、培養 と表現型DSTではなく、Xpert MTB/RIFまたはXpert Ultraを使用すべきです(強い推奨、証拠の確 実性が高い)。この推奨事項は、特定の診断方法(Xpert MTB/RIFまたはXpert Ultra)の使用を強 く推奨しています。また、「証拠の確実性が高い」という注釈は、この推奨事項が強固な科学的根 拠に基づいていることを示しています。 良い実践の声明 (Good Practice Statement):オピオイド依存症の治療に関する良い実践の声明。 オピオイド依存症の治療は、医療システム内で提供されるべきです。この声明は、特定の診断や治 療方法を推奨するものではなく、オピオイド依存症の治療が医療システム内で行われるべきである というより一般的な原則を述べています。 実装の考慮事項、ツール、ヒント (Implementation considerations, tools and tips):定の治療に 先立つ診断能力についての考慮事項です。 イソニアジド耐性結核の推奨事項を適切に実装するための最低限の診断能力は、イソニアジド耐性 結核の治療開始前にリファンピシンに対する迅速な分子検査を必要とします。このテキストは、特 定の治療プロトコル(イソニアジド耐性結核の治療)を実行する前に、必要な診断手段(リファン ピシンに対する迅速な分子検査)について述べています。これは、実装についての具体的な考慮事 項やヒントを提供しています。
追加事項: 1. Recommendations は、しばしば、「remarks・備考」と呼ばれる 記述でサポートされる。これらの備考は、推奨事項を説明し、理解に 必要な条件を記述するために必要とされます。また、「実装の考慮事 項」、「ツール」、「ヒント」は、推奨事項の適切な使用を促進する 追加の詳細を提供することができます。 2. 研究推奨:ガイドライン内の他の声明には、研究の文脈での介入の使 用を特定する「研究推奨」があります。これらは明示的または暗黙的 に行動を起こすことを示唆していることがあります。 しかしながら、WHOのガイドライン作成ハンドブックなどの権威ある文書 には、どのような種類の実行可能な記述が存在するか、またはガイドライ ン作成グループによってなされるべきかについての包括的な記述はまだ含 まれていない。この論文の目的は、ガイドラインにおける実行可能な記述 を特定し、提示するための概念的枠組みとともに分類法を提案することで あり、ガイドライン開発者がガイドラインにおける勧告やその他の必要不 可欠な記述を最適に提示することを支援することである。
WHOの文章を検討した結果、こんな感じに推奨やそれ以外の声明が分類できた: Formal recommendations 定義 Definition::正式な推奨とは、特定の集団において、また関連する場合は特定の設定において、 2つ以上の管理または政策オプション(介入)の間の選択に関する実行可能な声明である。代替の選 択肢(すなわち、比較対象)が自明でない場合は、勧告に明記する。これらの記述は正式な審議プ ロセスの結果であり、体系的な文献検索と評価プロセスから得られたエビデンス群との明確かつ直 接的な関連性を含んでいる。 説明と注釈 Explanation and notes:ステートメントには、選択肢を支持する明確な方向性(選択肢 に賛成か反対か)と強さ(例えば、強いか条件付きか)を示すべきである。勧告を行う際に考慮し たすべての要素(介入効果、検査精度、価値や費用など)について、勧告の強さと裏付けとなる証 拠の確実性が明示されていることが理想的である。正式な推奨は、熟慮され、構造化され、透明性 のある開発プロセスによって支えられなければならない。できればエビデンスプロファイルの形で、 エビデンスへの明確かつ直接的なリンクが提供される。特に、その方向性と強さを決定する要素に ついては、システマティックレビューや医療技術評価によって裏付けされるべきである。 それは何か What it is: 特定の集団において、また関連する場合は特定の設定において、2つ以上 の管理または政策オプション(介入)の間の選択に関する実行可能な声明である。正式に審議され、 関連するエビデンスと明確かつ直接的な関連がある。 そうでないもの What it is not: 完全なガイドライン、方針声明、その他の基準設定文書。 何のためにあるのか What it is for: エビデンスに基づく意思決定に直接利用したり、実務者が実 施したりすることができる。
Remarks 定義: Remarks備考は、PICOサブドメイン(例:集団特性)および/または1つ以上の特定の推奨またはグッド プラクティス ステートメント(例:推奨が条件付きである場合、介入の選択肢についてユーザーを導く)の枠をは める条件の解釈を支援する。これらは単独では実行できない。 説明と注釈: この点については混乱が見られるが、備考には実行可能な提案を含めるべきでない。勧告またはグッ ドプラクティスの記述と、実際に付随する注釈は、不可分の単位と見なすべきである。 それは何か: 補足的な説明を提供する、正式な勧告またはグッドプラクティス ステートメントに属する不可分の 単位である。 そうでないもの 単独でも成り立つ実行可能な声明。 何のためにあるのか: 勧告の枠組みを支え、利用者を導く。 Research only recommendations 定義:研究のみの推奨とは、特定の集団における介入選択肢の使用を研究設定に限定する推奨である。 説明と注釈 1)利用可能なエビデンスの確実性が、ガイドラインパネルが正式な勧告を出すことを許さない、さら に、2)実行可能である、3)受け入れ可能な研究が、介入の望ましい結果または望ましくない結果に関する不確実 性を低減する可能性がある。これらの勧告は、介入が(研究の文脈において)使用される可能性のある集団または 設定について記述されるべきである。研究のみの推奨は、今後の調査に情報を提供するのに十分な詳細を含むべき である。研究のみの推奨は、研究の文脈以外では介入を使用しないよう明示的な[強い]推奨を伴うことがある。. 正式な推奨もまた研究に示唆を与えるが、介入を研究設定内で使用することを制限しない。エビデンスの確実性が 高い場合、研究のみの推奨は通常適切でない:このような状況では、正式な、時には強力な推奨の方がより適切で あろう。 それは何か: エビデンスを用いて明示的に作成された行動可能な声明である。 そうでないもの 臨床実践、公衆衛生、保健政策に対する正式な勧告である。 何のためにあるのか: 正式な研究の文脈での使用
Good Practice Statements 定義:グッド・プラクティス・ステートメントとは、必要な実行可能で明確なガイドラインの記述である。集団と 介入の選択肢、そして適切であれば、推奨の比較対象が記述されている。 説明と注釈:グッドプラクティスステートメントは、エビデンスの確実性や推奨の強さの正式な評価には適さない。 グッド・プラクティス・ステートメントの作成は、5つの原則を遵守し、評価のために以下の質問に答えるべきで ある: 1.エビデンスの収集と要約は、ガイドラインパネルの限られた時間とエネルギー(機会費用が大きい)の使い方が 悪いか? 介入効果のエビデンスを評価しても、間接的なエビデンスしか得られないか。倫理的・人権的な問題か ら、介入の代替案が選択される可能性は極めて低いか? 2.そのメッセージは実際の医療行為について本当に必要か? ガイドライングループは、なぜこのメッセージが必 要なのか、その根拠をガイドライン本文中に示しているか。その声明は臨床実践に関連しているか? 3.関連するすべてのアウトカムと下流の潜在的な結果を考慮した結果、そのグッドプラクティ スステートメントを 実施することは、大きな正味のプラス結果をもたらすか。 そのグッドプラクティス ステートメントを実施するこ とで、正式な推奨を策定するアプローチに従わなくとも、健康アウトカム やその他の関連するEvidence to Decision(EtD)基準に正味で大きなプラスの影響があるか。 4.間接的なエビデンスを結びつける明確で明確な根拠が十分に文書化されているか。 グッドプラクティスステー トメント実施後の正味の望ましい結果(主に大きな健康利益)を推論 するために使用される、関連する一連のエビ デンスの記述があるか。 5.声明は明確で実行可能か? どのような行動が必要かを明示しているか。関心のある集団または設定(医療制度 に関する記述の場合)は、記述の中で特定されているか。 それは何か: 明確で必要なアクションが可能な声明である。 そうでないもの: エビデンスの強さや確実性が定義された推奨である。 何のためか: 意思決定に直接使用する
Implementation considerations, tools and tips 定義:実施上の考慮事項、ツール、およびヒントとは、勧告に基づいて介入の選択肢の一つを選択した後、それを実施するために実行可能 で関連しうる記述である。介入(例えば、投薬量や複雑な介入の正確な説明)のような正式な勧告の要素を支持する情報を含むことがある。 選択された介入の実施および/またはその効率的な利用を促進するツールやヒントに関する情報が含まれることもある。これらは、関連する 推奨なしには実行できない。 説明と注釈: これらの記述には、勧告の実施に関連する(例えば、衡平性に関する考慮事項を含む)方法、誰が、どこで、何を、いつ行う かが記述されていることが多い。実施に関する考慮事項、ツール、ヒントは、エビデンスと明確な関連がない場合がある。さらに、状況に よってはエビデンスレビューが無駄になることもある(例えば、利用可能な投薬量が1回のみで、それが実施上の考慮事項、ツールおよびヒ ントの一部として記述されている;介入の投与または使用の様式;タイミング;予防措置;検査の使用方法;技術的要件)。実施上の配慮 は、別の文書または媒体で利用できるようにし、ガイドラインの正式な勧告とリンクさせることができる。 それは何か: 正式な勧告の実施を支援する。 そうでないもの: 独立した正式勧告 情報を提供する 何のためにあるのか: 実施強化のための具体的な Informal recommendations 定義:非公式な推奨は、特定の集団における、また関連する場合は特定の設定における、1つ以上の介入選択肢の選択に関する実行可能な声 明である。これらの声明は、正式な審議プロセスを経て発表されたものではなく、ガイドラインのために収集されたエビデンス集と直接関 連するものではなく、グッドプラクティス声明を特定する厳密な一連の論理的ルールを満たすものではない。 説明と注釈:代替の選択肢(すなわち、比較対象)が自明でない場合は、勧告に明記してもよい。非公式な勧告は、エビデンスから情報を 得ているが、そのエビデンスとの明確で透明性のある結びつきを欠いているか、または勧告を作成するための体系的レビューなどの構造化 され た、または調整されたプロセスの結果ではない場合がある。エビデンスと勧告との直接的な関連性が欠落している場合、この種の勧告 は、そうでないにもかかわらず、熟慮され、構造化され、透明性のあるプロセスから得られたものと誤解される可能性がある。そのため、 正当化されることのない正式な勧告のような情報力があると思われてしまう。さらに、非公式な勧告をグッドプラクティス宣言と区別する ためには、勧告された選択肢の正味の望ましい結果が、正式なプロセスを経なければ明らかでない(反対の行動方針が不適切とみなされな い)か、正味の望ましい結果を裏付ける間接的な証拠が記述されていないかのいずれかである。正式な勧告で答えられる問題を、非公式な 勧告で取り上げるべきではない。非公式な推奨は、一般的に信頼できるエビデンスの統合に基づいていないため、エビデンスに基づくもの と見なすべきではない(その場合は正式な推奨となる)。信頼性の高いエビデンスに基づくガイドラインは、非公式な推奨を完全に避ける ことができるはずである。 それは何か: 特定の集団における、また関連する場合は特定の設定における、1つ以上の管理または政策オプション(介入)の選択に関す る実行可能な声明である。 そうでないもの:正式に審議されたものではなく、かつ/または、正式に審査・評価された体系的なエビデン スと明確かつ直接的な関連性がなく、グッドプラクティスステートメントの基準を満たさないため、適切な推奨ではない。 何のため にあるのか: 関連する系統的にレビューされたエビデンスのレビューなどの追加的な精査なしに、意思決定に使用すべきではない。
3.メタ分析の結果のフォレストプロットの読み方 メタ分析・meta-analysisを一言で言うと、症例数とイベント数などを 考慮して、各論文に重み付けを行って計算する方法。 各論文を 単純に 統合する のではない 各論文に 重み付け して統合
フォレストプロット:Forest plot(串刺し図) 平均値のみ示すより、その推定値のおおよ その幅を示した方が臨床に役立つ。この幅 が、2群が同じとなる、「0」「1」の線 をまたいでないと、統計学的有意差ありと なるが、診療ガイドラインでは有意差あり なしでの評価はほとんど使わない。 95%信頼区間が線であるの で、区間が広いと線が長く 精確でない 点推定:四角が大き いほどイベント数か 症例数(重み)が大 きい 統合値 各研究の結果がバラつ いているという非一貫 性を評価するための統 計指標 菱形が、メタ分析の結果で、横 の長さが信頼区間:真ん中をま たいでなければ統計学的有意差 あり(臨床的に意味のある閾値 ではない) 真ん中の線:かりに2群が 同じ値ならば、2群の比較 を「差」で示すと「0」、 「比」なら「1」となる。
4.エビデンスプロファイルとSoF表とは エビデンスの確実性の評価には、以下の5つの要因を、それぞれ評価した後に、総合的に 決定する。エビデンスプロファイル・SoF表は、この5つの要因と、メタ分析の結果(相 対的な結果だけでなく、絶対的な結果も)を、アウトカムごとに、見やすい表にしたもの。 研究の限界 (limitation, risk of bias) 非一貫性 (inconsistency) 非直接性 (indirectness) 不精確さ (imprecision) 出版バイアス (publication_bias) もし、そのアウトカムの結果を構成する、いろいろな論文にバ イアスが多く存在していたら・・・、 もし、論文間で、結果が異なっていれば・・・、 もし、最初に想定した臨床の疑問の患者層と、選択した論文の 患者層が異なっていれば・・・、 もし、症例数の小さな、あまり精確でないデータを、メタ分析 と称して、集めて症例数が大きくなって有意差がでただけだっ たら・・・、 もし、有意差がなかったからと報告されなかった論文や、都合 が悪いので論文に書かなかったアウトカムが、たくさんありそ うな状況だったら・・・、
このグレードダウンの5要因を、横に並べて見やすい表にしたのが、 エビデンスプロファイルとよび、 その要因を脚注に記載して、メタ分析の結果をより分かりやすく表記したのがSoF表とよぶ No. of studies アウトカム アウトカム Design Risk of bias Inconsi stency Indirec tness Imprec ision Other consid eration s No. of patie nts Effect Certain ty Impor tance
SoF表の構造(実際の例) 80
SoF表の構造(実際の例) 絶対効果 研究数と 累計被験者数 アウトカム1 相対効果 アウトカム1のエビデンスの確実性 アウトカム1の効果の大きさ アウトカム2 アウトカム2のエビデンスの確実性 アウトカム2の効果の大きさ 脚注にグレードダウンの理由を記載 81
5.Evidence to Decision framework(EtD表)とは:実例より(1) そして、利益だけでなく害・価値観と意向・コストなど一覧とし、パネリ ストだけでなく読者にも推奨の判断ができる透明性のための表 CQ・PICO 問題の重要性 利益の大きさなど https://guidelines.gradepro.org/profile/783DCF1B-50FC-72D0-A1E1-3C31011E9471
Evidence to Decision framework(2) 価値観 各アウトカムの相対的重要性が、根 拠となる参考文献付で記載されてい る 相対的重要性 1 0.5 0.5 0.7 益と害の バランス この実例では、ここに、説明の記載がな かったが、本来は必要である リソース コスト
Evidence to Decision framework(3) (1)(2)などで評価した判定の一覧表 推奨のタイプと、パネリスト投票状況
Evidence to Decision framework(3) (1)(2)などで評価した判定の一覧表 この一覧表を見ると、おおよその、 推奨の方向性や強さが想定できる 推奨のタイプと、パネリスト投票状況
6.推奨の決定は、 EtD表から、何となく、こうだよね~で決めるのではない 診療ガイドラインの推奨には、「どのぐらい強く推奨するか?」・ 「介入行なうことを推奨するのか、行なわないように推奨するの か?」と、強さと方向がある。GRADEアプローチでは、推奨の強さ と方向として、以下の定義と用語を採用している。 残念な事に、この定義のみを勉強して、何となく、この定義にあうと いう雰囲気で投票して、一致率などを記載するような診療ガイドライ ンが多い。 推奨度 定義 臨床医にとって 方向・用語 介 入 に よ る 望 ま し い 効 果 ( 利 ほぼ全員が推奨される介入を受け 推奨する・しない 強い推 強く推奨する・しない 益)が望ましくない効果(害・負 るべきである。 奨 ・・・しないことを推奨する 担・コスト)を 上回る、ま たは下 =推奨= 回る確信が強い 介 入 に よ る 望 ま し い 効 果 ( 利 意思決定支援は、患者が自身の 弱く推奨する・しない 弱い推 益)が望ましくない効果(害・負 価値観や意向に基づいて意思決 条件付きで推奨する・し 奨 ない・提案する・しない 担・コスト)を 上回る、ま たは下 定を行うのにおそらく有用だろう。 =提案= ・・・しないことを提案する 回る確信が弱い 理念として、この決定には、EBMの原則と同じく、エビデンスだけで は臨床決断をするのに決して十分ではないため、利益だけでなく害・ 価値観と意向・コストなども考慮する。そして、評価方法は、かなり 厳密な方法が存在する。特に、EtD表(Evidence to Decision framework)という透明性を確保する表を作成し、批判に耐えられ る評価が必要とされている。
ポイント:推奨草案は、以下のような評価をへて作成された科学的な文章である。と言っても、実施には、ここ まで科学的に作成する事は困難である。そのため、パネル会議での議論が必要となることも理解されたい。 そのための前提として、有意差がある・ないの二元論での考えから脱却することが必要であるので、その説明か ら行う。 「P値至上主義・有意差がない」場合についての注意点: これまでに、「有意差がないから同等とは言えない」は、良く知っていると思います。また、「P値が 0.052の場合に、有意な傾向があったと書くのは、間違いではないがミスリーディングの可能性がある ので注意すること」というのも知っていると思います。 ここで知って欲しいのは、プラセボに対して新薬の有効の1.2のリスク比(すなわち、20%高い: 95%信頼区間 -3%~48%)で、P = 0.091で有意差がなかった場合、差があるとは言えないというこ とだけで、もしかしたら差がある可能性もあると言うことです。二重否定の文章で分かりにくいかもし れませんが、新薬の効果がないということではないと言うことです。注意が必要なのは、これを誤って、 効果がないと表現すると、差がない・同等であると考えているのと同じ事となります。 統計学的な有意差は認めなかったのは事実であるが、帰無仮説を棄却できなくても、治療がアウトカム に影響しないとは言い切れない。P値0.05での有意差があるないの二元論はデメリットが多いというこ とです。意訳となるが、点推定値で20%の効果があったが、稀には、わずか3%の悪化の可能性も考え られるが、稀には48%の効果となることもあったという結果を議論しましょうということです。ぶっ 飛び意訳なら、稀なたった3%の悪化のため、点推定値の20%の効果を無視してはならない(もちろん、 エビデンスの確実性が高い場合)。 参考:Scientists rise up against statistical significance https://www.nature.com/articles/d41586-019-008579?utm_source=twt_nnc&utm_medium=social&utm_campaign=naturenews&sf209757517=1 https://www.dr-kid.net/pvalue-dichotomania https://diamond.jp/articles/-/338672
仮想例(介入A薬 VS 対照B薬):相対的評価 以下の仮想例を考える。 まず、最初に必要な事は、相対危険度など、想定的な評価で推奨を判断するのではなく、絶 対的な評価で推奨を判断するべきである(無理なこともある)。その理由は、対照群のリス クによって、判断が大きく異なるからである。よって、絶対的評価の記載がなければ、 GRADEアプローチに、厳密に従ってない可能性がある。 アウトカム 相対危険度(95%CI) エビデンスの確実性 全原因死亡 HR 0.96 (0.68-1.33) 低 局所再発 HR 0.94 (0.64-1.38) 低 遠隔転移 HR 0.91 (0.64-1.30) 低 有害事象 RCTの論文から抽出し、多く存在する 非常に低 価値観 アウトカムとして死亡を重視する・患者がA薬の錠剤が大き く飲みにくいので服用に関しての意向はバラつくだろう コスト A薬:薬価10000円、B薬:薬価500円
仮想例(介入A薬 VS 対照B薬):絶対的評価 アウトカム 患者1000人あたりの絶対効果推定値 (95%CI) エビデンスの確実性 全原因死亡 -12人 (-107人~ +93人) 低 局所再発 -17人(-109人~ +98人) 低 遠隔転移 -9人(-35人~ +28人) 低 有害事象 +59.5人(+1.4人~ +700人) 非常に低 価値観 アウトカムとして死亡を重視する・患者がA薬の錠剤が少し 大きく飲みにくいので服用に関しての意向はバラつくだろう コスト A薬:薬価1000円、B薬:薬価500円 マイナスが、介入A薬が望ましい効果になります。どう でしょうか? あなたは、介入A薬を推奨しますか?
仮想例(介入A薬 VS 対照B薬) アウトカム 患者1000人あたりの絶対効果推定値 (95%CI) エビデンスの確実性 全原因死亡 -12 (-107 ~ +93) 低 局所再発 -17 (-109 ~ +98) 低 遠隔転移 -9 (-35 ~ +28) 低 有害事象 +59.5 (+1.4 ~ +700) 非常に低 価値観 アウトカムとして死亡を重視する・患者がA薬の錠剤が少し 大きく飲みにくいので服用に関しての意向はバラつくだろう コスト A薬:薬価1000円、B薬:薬価500円 まず、推奨の強さは、エビデンスの確実性が低いので、「弱い」とするパネルが多いのでは ないだろうか。 また、推奨の方向は、有害事象が多いが、死亡・再発・転移ともに効果があるため、A薬を 「推奨する」と考えるパネルが多いだろう。よって、「A薬を弱く推奨する」となる可能性が 高い。 これは、これで大きく間違った判断でないと思われるが、厳密に評価するとは、どういうこ とかを、次のスライドから説明する。
実際の作成では、さらに複雑な事を行い、 できる限り科学的・客観的な評価を心がけています まず、患者の価値観を、各アウトカムにおいて相対的重要性を決定する必要がある。すなわ ち、これら価値観の調査研究に従う必要がある(実際には研究がなく、委員会のパネリスト のアンケートによることも多い)。ポイントは、有害事象が、軽度なものか重篤なものか、 適切に判断することが必要とされる。 そして、その相対的重要性と絶対効果推定値から、利益と害のバランスそのものを定量化す る。そうすると、効果はありそうだが、害が勝っていることが判明する(さらに厳密に行う ならば、アウトカム全ての95%CIの上限と下限で、推奨が異なるかまで判定する)。 しかし、害のエビデンスの確実性が非常に低のため、パネリストの判断はばらつく可能性が あると思われる。 患者1000人あたりの 相対的重 アウトカム 絶対効果推定値(95%CI) 要性 患者1000人あたりの全原因死 亡相当イベント単位による重 要性調整効果推定値(95%CI) エビデンスの確 実性 全原因死亡 -12 (-107 ~ +93) 1 -12 (-107 ~ +93) 低 局所再発 -17 (-109 ~ +98) 0.5 -8.5 (-54.5 ~ +49) 低 遠隔転移 -9 (-35 ~ +28) 0.5 -4.5 (-17.5 ~+14) 有害事象 +85 (+2 ~ +1000) 0.7 +59.5 (+1.4 ~ +700) -12-8.5-4.5+59.5=+34.5 -17×0.5=-8.5 低 非常に低 介入A薬の益と害のバランスは害が大きい
ここまで定量化できない場合であっても、少なくとも、最小臨床的効果などを設定 し、それに対して、メタ分析の効果推定値と95%信頼区間が、どのような関係にあ るのかを評価することは大切と考えられる。 すなわち、単に、効果が大きそうだ…という、一部の人間の価値判断だけでなく、 より客観的・科学的な基準に従った判断をできる限り行って、推奨文の草案を作成 しています。 アウトカム死亡:最小臨床的効果(MID) 効果なし -12 介入A優位 -10 RD=0 対照優位 推奨草案:●●病の中程度の重症度の患者に対して、介入A薬より対照B薬を使うこと を診療ガイドラインパネルが提案する(条件付きの推奨/エビデンスの確実性 非常に 低)