1.7K Views
May 16, 23
スライド概要
Antidepressants for pain management in adults with chronic pain: a network meta-analysis
成人の慢性疼痛患者における疼痛管理のための抗うつ薬:ネットワークメタ解析
https://www.cochranelibrary.com/cdsr/doi/10.1002/14651858.CD014682.pub2/full
ネットワークメタ分析の論文の図表の理解しよう(コクラン が公開まで非公開編):慢性疼痛患者と抗うつ剤P34まで Antidepressants for pain management in adults with chronic pain: a network meta-analysis 成人の慢性疼痛患者における疼痛管理のための抗うつ 薬:ネットワークメタ解析 https://www.cochranelibrary.com/cdsr/doi/10.1002/146 51858.CD014682.pub2/full DeepL翻訳利用
サマリー・緒言など
Abstract 背景 慢性疼痛は成人に多い。これまでのレビューでは、特定の抗うつ薬が痛みの軽減に有効であり、特定の慢性疼痛状態において患者の変 化に対する全体的な印象を改善することに一定の効果があることが示されている。 目的 成人の慢性疼痛(頭痛を除く)に対する抗うつ薬の比較有効性と安全性を評価すること。 検索方法 CENTRAL、MEDLINE、Embase、CINAHL、LILACS、AMED、PsycINFOデータベース、および臨床試験登録から、2022年1月に慢性 疼痛疾患に対する抗うつ薬の無作為化対照試験(RCT)を検索した。 選択基準 慢性疼痛に対する抗うつ薬を任意の比較対象に対して検討したRCTを対象とした。 比較対象がプラセボ、他の薬、他の抗うつ薬、または同じ抗うつ薬を異なる用量で投与するものであれば、ダブルブラインドとした。 ダブルブラインドできないアクティブコンパレータを持つRCT(例:心理療法)も含めたが、バイアスの危険性が高いと評価した。 追跡期間が2週間未満のRCTや、各群の参加者が10人未満のRCTは除外した。 データ収集と分析 2名のレビュー著者が別々にスクリーニングを行い、データを抽出し、バイアスのリスクを判断した。各アウトカムについてベイズNMA とペアワイズメタ解析を用いてデータを統合し、累積順位曲線下表面(SUCRA)を用いて抗うつ薬を有効性の観点からランク付けした (後に解説)。エビデンスの確実性を評価するために、主にConfidence in Meta-Analysis(CINeMA)・ROB-MENを用いた(後に解 説) 。ネットワークの複雑さによりCINeMAを使用できない場合は、GRADEを用いてエビデンスの確実性を評価した。 アウトカム 主要アウトカム:実質的な(50%)疼痛緩和、疼痛強度、気分、有害事象とした。 副次的アウトカム:中等度の疼痛緩和(30%)、身体機能、睡眠、QOL、Patient Global Impression of Change(PGIC)、重篤な有 害事象、離脱であった。
Abstract 主な結果 本レビューでは、176の研究、合計28,664人の参加者を対象とした。 研究の大半はプラセボ対照(83件)、並行群(141件)であった。 最も一般的な疼痛疾患は、線維筋痛症(59試験)、神経障害性疼痛(49試験)、筋骨格痛(40試験)であった。 RCTの平均期間は10週間であった。7件の研究は使用可能なデータを提供しなかったため、NMAから除外された。 大半の研究は、短期的なアウトカムのみを測定し、低気分や他の精神衛生状態の人々を除外した。 有効性のアウトカム全体において、デュロキセチンは中程度~高の確実性のエビデンスを有する抗うつ薬として一 貫して最も高いランクに位置づけられた。デュロキセチンの研究では、ほとんどのアウトカムにおいて、標準用量 は高用量と同等の有効性を示した。 ミルナシプランは、エビデンスの確実性はデュロキセチンよりも低かったが、次に有効な抗うつ薬としてしばしば ランク付けされた。 慢性疼痛に対する他の抗うつ薬の有効性と安全性については、強固な結論を導き出すには十分な証拠がなかった。 有効性の主要アウトカム デュロキセチン標準用量(60mg)は、実質的な疼痛緩和(オッズ比(OR)1.91、95%信頼区間(CI)1.69~ 2.17;16試験、4490人;中程度の確実性)および連続した疼痛強度(標準化平均差(SMD)-0.31、95%CI 0.39~-0.24;18 試験、4959人;中程度の確実性)において小規模から中規模の効果を見せた。 痛みの強さについては、ミルナシプラン標準用量(100mg)も小さな効果を示した(SMD -0.22, 95% CI -0.39 to 0.06; 4 studies, 1866 participants; moderate-certainty evidence)。ミルタザピン(30mg)は、気分に対 して中程度の効果を示し(SMD -0.5, 95% CI -0.78 to -0.22; 1研究、406人; 低の確実性)、デュロキセチンは 小さな効果を示した(SMD -0.16, 95% CI -0.22 to -0. 1;26の研究、7952人の参加者、中程度の確実性);し かし、ほとんどの研究が精神衛生状態の参加者を除外しているため、平均不安および抑うつスコアは、ベースライ ンですでに「正常」または「不顕性」の範囲にある傾向があることに注意することは重要である。
気になったこと?(この分野、詳しくないので間違いかも) 「最も一般的な疼痛疾患は、線維筋痛症(59試験)、神経障害性疼痛(49試 験)、筋骨格痛(40試験)であった。」 えっ、この分野、これらの違う病態を、一緒にして良いの? 本文には、分けて解析しているのかな~。気になるので、気にしつつ読んで みよう。
Abstract セカンダリーアウトカム すべてのセカンダリーアウトカム(中等度疼痛緩和、身体機能、睡眠、QOL、PGIC)において、 デュロキセチンとミルナシプランは、効果は小さいものの、中程度の確実性を有するエビデンスで、 最も上位の抗うつ剤となった。デュロキセチン、ミルナシプランともに、標準用量は高用量と同程 度の効果があった。 安全性 すべての抗うつ薬において、すべての安全性アウトカム(有害事象、重篤な有害事象、離脱)につ いて、非常に低い確実性であった。これらの結果について、NMAから信頼できる結論を導き出すこ とはできない。 著者らの結論 我々のレビューとNMAは、25種類の抗うつ薬を調査した研究にもかかわらず、慢性疼痛治療におい て我々が確信している唯一の抗うつ薬はデュロキセチンであることを示している。デュロキセチン は、標準用量ですべてのアウトカムにおいて中程度の有効性を示した。 また、milnacipranには有望なエビデンスがあるが、これらの結論に自信を持つためには、さらに質 の高い研究が必要である。 他のすべての抗うつ薬のエビデンスは、確信度が低いものであった。 RCTでは気分が低下している人が除外されているため、慢性疼痛とうつ病を有する人に対する抗う つ薬の効果を立証することはできなかった。 現在、抗うつ薬の長期的な有効性に関する信頼できる証拠はなく、どの時点においても慢性疼痛に 対する抗うつ薬の安全性に関する信頼できる証拠はない。
はじめに 背景 Description of the condition Description of the intervention How the intervention might work Why it is important to do this review 目的 慢性疼痛(頭痛を除く)を有する成人患者に対する抗うつ薬の比較的な有効性と安全性 を評価する。 • 慢性疼痛(頭痛を除く)のある成人に対する抗うつ薬の比較的な有効性と安全性を 評価する: • 抗うつ薬の種類、クラス、用量ごとの有効性を評価する。痛み、気分、身体機能、 睡眠、QOL、PGICの改善における抗うつ薬の種類、クラス、用量別の有効性を評価 する。およびPGICを評価する; • 抗うつ薬の有害事象および重篤な有害事象の発生件数の評価抗うつ薬の有害事象と 重篤な有害事象の数をタイプ、クラス、用量別に評価すること; • 痛み、気分、有害事象の治療における抗うつ薬の有効性をランキングする。有害事 象の評価
方法
患者など Criteria for considering studies for this review Types of studies 基本的にRCT(抄録程度の理解で良いと思う) Types of participants 国際疼痛学会(IASP)の慢性疼痛の定義(すなわち、少なくとも3ヶ月の期間;IASP 2019)に合致する、身体のいずれかの部位(頭痛を除く)の一次または二次疼痛を主 訴として報告する成人(18歳以上)を対象とした。 個々の研究の包含基準に重症度が含まれているかどうかを抽出したが、参加者の慢性疼 痛の重症度に関係なく、すべての研究を対象とした。 参加者の主訴が頭痛や片頭痛である研究は、過去のコクランレビューで取り上げられて いたため除外した(Williams 2020)。 この疾患はIASP基準に適合するが、一次および二次性頭痛の診断、分類、治療は、他の 疼痛疾患とは異なるものであり、臨床試験は、対症療法ではなく、さらなる頭痛や片頭 痛の予防を主目的としている。 慢性疼痛が臨床試験の焦点である限り、複数の健康状態を持つ参加者を対象とした。
介入 抗うつ薬であれば、どのような用量でも、どのような適応症 でも対象としたが、主に慢性疼痛患者の治療に使用される プ ラセボまたは積極的介入と比較した。 薬剤の内容は、以下であったと記載(抜粋): 以下のクラスに分類される抗うつ薬 • 三環系抗うつ薬(TCA):アミトリプチリン・・・ • 選択的セロトニン再取り込み阻害薬(SSRI):フルボキサ ミン・・・ • ロトニン・ノルアドレナリン再取り込み阻害薬(SNRI): ・・・ ・・・
研究に組み入れた試験や介入についての補足 アクティブな比較対象がある研究を対象とした。 抗うつ薬と他の介入を併用する研究は、他の介入のみのアー ムがあり、抗うつ薬の効果を分離できる限り、対象とした (例:抗うつ薬+薬剤対薬剤)。 抗うつ薬の効果を分離する方法がない組み合わせの研究 (例:抗うつ薬A+薬物対抗うつ薬B)は含まなかった。 このレビューでは、包含基準を満たした参加者は原則として、 対象となる抗うつ薬のいずれかに無作為に割り付けられる可 能性が等しいと仮定した;しかしながら、どの抗うつ薬を研 究するかによって、患者の治療や結果に対する期待に差が あったかもしれないことを認めるものである。
アウトカムについて 我々は、文献を通してさまざまな結果測定法が使用されることを予期していた。 上述の苦痛とうつ病の区別のため、このレビューでは、診断されたうつ病、自己報告で 測定された気分、苦痛を含む転帰として「気分」という用語を使用した。 Due to the distinction between distress and depression discussed above,this review used the term 'mood' as an outcome, to include depression that is diagnosed, mood that is measured via self-report, and distress. 痛みと気分については、該当する場合、臨床試験における方法、測定、痛み評価に関す るイニシアチブ(IMMPACT)のガイダンスに沿って、実質的な改善を示すために、痛 みの軽減または50%以上の改善にアウトカムを二分化した(Dworkin 2008)。 可能であれば、介入直後、短期フォローアップ(治療後12週間以内)、長期フォロー アップ(治療後12週間以上)で、抗うつ薬と比較対象薬を比較する別々のNMAを計画 した。 複数のフォローアップ時点を含む研究では、各期間の中で最も新しい時点を採用した。 同じ結果に対して複数の尺度が使用されている場合(例えば、連続的な痛みの強さにつ いては、0から10の数値評価スケールとMcGill Pain Questionnaire(Melzack 1975) の両方が報告されている)、その分野で最も有効で信頼でき、広く使われている尺度か ら抽出を行った。
主要アウトカムと副二アウトカム 抄録程度で良いので 主要アウトカム:実質的な(50%)疼痛緩和、疼痛強度、気分、有害事象 とした。 Our primary outcomes were substantial (50%) pain relief, pain intensity, mood, and adverse events. 副次的アウトカム:中等度の疼痛緩和(30%)、身体機能、睡眠、QOL、 Patient Global Impression of Change(PGIC)、重篤な有害事象、離脱 であった。 Our secondary outcomes were moderate pain relief (30%), physical function, sleep, quality of life, Patient Global Impression of Change (PGIC), serious adverse events, and withdrawal.
検索・研究の選択・Data extraction and management 抄録で良いでしょう。 検索方法 CENTRAL、MEDLINE、Embase、CINAHL、LILACS、AMED、PsycINFOデータベー ス、および臨床試験登録から、2022年1月に慢性疼痛疾患に対する抗うつ薬の無作為化 対照試験(RCT)を検索した。検索式は、p473のAppendix 1.Search strategies。 選択基準 慢性疼痛に対する抗うつ薬を任意の比較対象に対して検討したRCTを対象とした。 比較対象がプラセボ、他の薬、他の抗うつ薬、または同じ抗うつ薬を異なる用量で投与 するものであれば、ダブルブラインドとした。ダブルブラインドできないアクティブコ ンパレータを持つRCT(例:心理療法)も含めたが、バイアスの危険性が高いと評価し た。 追跡期間が2週間未満のRCTや、各群の参加者が10人未満のRCTは除外した。 詳細は、Figure 1. PRISMA flow diagram of studies found, screened, and included。 Data extraction and management こんなデータを、論文から抽出して一覧としたよというだけで、飛ばしても良いでしょ う。
研究内のリスクオブバイアスの評価 選択した各研究の、リスクオブバイアスは、以下の評価を行った。 Cochrane risk of bias tool(RoB 1)とのことで、最新のRoB2.0という ツールでなく、古いツールだったようだ。 その詳細が記載されている。 このRisk of Biasと、先の、Data extraction and managementが、p88 ~p401までの恐ろしい分量の、 CHARACTERISTICS OF STUDIES Characteristics of included studies に記載がある。 Risk of Biasは、Figure 2. Risk of bias of included studies by domain とFigure 3. Risk of bias of included studies by studyにも記載あり。
治療効果の測定方法 連続データを測定するアウトカム(疼痛強度、気分、身体機能、睡眠、QOL、PGIC連 続):介入後のスコア(介入期間終了時の平均スコア)または変化スコア(ベースライ ンのスコアからの平均変化)のいずれかでデータを報告した研究があるので、別々に分 析を行った。 測定方法が研究間で異なるので、単なる平均差MDでは、その研究間の違いで統合でき ない。よって、SDでMDを割ったSMDを使うと統合できる。 疼痛管理に関する研究ではよくあることだが、すべてのアウトカム(PGICを除く)にお いて、研究者はアウトカムを測定するために幅広い尺度を使用していた。そのため、 データを抽出した後、標準化平均値(SMD)と95%信頼区間(CI)に変換した。 しかし、SMDでは、単位がないので、効果が大きいのか小さいのか不明である。よって、 コーエンのdという経験値を用いる。 Cohen1988とCochrane Handbook for Systematic Reviews of Interventions (Higgins 2022a)に沿って、SMDを小(0.2)、中(0.5)、大(0.8)と解釈した。 相対危険度(RR)のが、わかりやすいが、NMAでは、計算の都合と、RRより統合しやす い(概説です)ので、ORを使う。ORなので、1.3でも1.3倍あったと表現してはならな い。 二値データ(実質的な痛みの軽減、有害事象、中程度の痛みの軽減、PGIC大いに/大い に改善、重篤な有害事象、離脱)のアウトカムについては、95%CI付きのオッズ比 (OR)を用いた。
分析単位の問題 ・欠損データへの対応 各RCTで、群分けが、わかりやすかったので、普通にできたと書いてある程度。 ほとんどの RCT では、参加者が異なる試験群に無作為に割り付けられたため、直接分 析が可能であり、 分析単位が複雑になることはなかった。 クロスオーバー RCT については、クロスオーバーの影響を避けるため、最初の期間 (クロスオーバー前)の結 果が報告されている場合は、それを抽出した。最初の期間の 結果が報告されていない場合は、抗うつ薬の半減期の5倍以上の十分な洗浄期間があれ ば、最終的な試験結果を抽出した(最低洗浄期間の長さは各抗うつ薬について個別に計 算)。クロスオーバー試験の大半は、両期間の効果を合わせて報告していた(第1期間 と第2期間の効果を別々に報告していたのは1件のみ)ので、これらの効果を合わせてク ロスオーバー試験を分析した。 検索では、包含基準に合致するクラスターRCTは見つからなかった。 データが抜け落ちているときに、統計的に代入するので、その方法。連続変数で良くあ るのが、標準偏差SDの記載がない場合。他のよく似た研究を集めて、その平均や中央値 を使って体入値とすると言うことが書いてある。 アウトカムに関連する研究レベルの統計データが欠落している場合、まずその研究の著 者に連絡を取るようにした。著者からデータを得られない場合は、Cochrane Handbook for Systematic Reviews of Interventions (Deeks 2022)のガイダンスに 従った。標準偏差が不足している場合は、Review Manager calculator (RevMan Web 2023)を使用して、研究で報告された他のデータから計算した。データのインピュート は行わず、データの欠落による各研究のバイアスリスクを評価した。
Heterogeneity異質性の評価方法 GRADEアプローチでは、研究間で結果が異なると、Inconsistency非一貫性と呼んでい た。しかし、NMAでは、特に、 CINeMAを使う人(後で解説)は、Heterogeneity異質 性と表現することが多い。その基準を書いてあるだけ。 異質性の評価 Cochrane Handbook for Systematic Reviews of Interventions (Deeks 2022)のガイダンスに沿って、Tau統計を使ってネットワークメタ解析内の異質 性を評価した。異質性の評価には、CINeMAを用い、各アウトカムに関する一対比較に ついてChi2testとI2統計量を算出した(Nikolakopoulou 2020)。 CochraneHandbook for Systematic Reviews of Interventionsにあるように、I2統計 量を以下のように解釈した(Deeks 2022)。 - 0%から40%:重要でない可能性がある - 30%~50%:中程度の異質性を表す可能性がある - 50%~90%:相当な異質性を示す可能性がある - 75%から100%:かなりの異質性 異質性を評価する際には、効果の大きさと強さを考慮した。
Transitivity(推移性) Transitivityは、右図のようなこと。 以下の要因について、調査した。 - 痛みの状態 - 年齢 - ベースライン時の痛みの強さ - ベースライン時のうつ病の重症度 - 治療期間、および - 投与スケジュール ネットワークの間接性を評価することで、これらの要因の影響を探った。 プラセボを含むこと、およびプラセボがtransitivity仮定に違反する可能性 に関する懸念は、一般的に(Cipriani 2013)、特にうつ病研究において (Rutherford 2009)、強調されている。そこで、ネットワークの検証の 一形態として、プラセボ対照研究とヘッド・トゥ・ヘッドのエビデンスを 提供する研究を明示的に比較することにした。
出版バイアス 出版バイアスの評価は、このように行ったよとの記載であり、一般的な方 法なので、飛ばして良い。 レビューマネージャー5(Review Manager 2020)のCochrane risk of bias tool(RoB 1)を用いて、研究プロトコルと事前に指定したアウトカ ムを確認することで報告バイアスを評価した(「含まれる研究のバイアス リスクの評価」の項で詳述した通り)。 また、10以上の研究が利用可能な抗うつ薬のペアワイズ分析には、 Cochrane Handbook for Systematic Reviews of Interventions (Page 2022)の助言に従って、ファネルプロットを用いた。 ファネルプロットは、CINeMAの一部であるROB-MENを用いて作成し、 ファネルプロットの非対称性によって有意な小規模研究の影響を評価する ために使用した。
データ統合方法・NMAの方法 アウトカムごとにNMAを行った。 NMAは、こんなものですという解説 NMAは、RCT内の介入の直接比較と、共通のプラセボ比較対象に基づく研究間の間接比較の両方からの情報(エビデンス)を組み合わ せる(Caldwell 2005; Jansen 2011)。直接比較(直接エビデンス)は、2つ以上の介入を試験で正面から比較した場合に発生する; 正面から比較することがない場合、介入は間接的に比較することができる(間接エビデンス)。 NMAで使った統計ソフト(Rというソフトで、パッケージが、 multinma。また、NMAには、頻度論的とベイズ的の2通りがあり、今回 はベイズを使った。治療薬に容量が記載ある場合は、 低・標準・高と分けて、治療薬A1、A2、A3と別の薬剤として比較したなどが記 載されている。 R(rproject.org)のパッケージmultinma(Phillippo 2022)を用いて実装したベイズ型ランダム効果NMAを用いて、すべての主要お よび副次アウトカムのデータを解析した。用量がネットワークに含まれる場合は、それらを分類し(低、標準、高)、別のノードとし て組み込んだ。ある研究で、同じ抗うつ薬の異なる用量を調査する複数のアームがあり、それが同じカテゴリーに分類される場合(例 えば、2種類の低用量)、それらを結合せず、multinmaパッケージを使用することにより、分析においてこれらを別々のアームとして 維持することができた。 治療効果の算出に使った統計手法が記載されているが、細かすぎで、飛ばして良いだろう。 治療効果には広義の正規事前分布を、異質性標準偏差には試験特異的な切片と半正規事前分布を用い、ランダム効果モデルを適用した。 4つのチェーンを使用し、各チェーンごとに2000回の反復と1000回のウォームアップ後の抽選を行った。 治療間で直接、ランダム化比較試験があった直接比較と、なかった治療間や、どのような治療間の比較が多かったかなどの、ネット ワークの接続性は、Figure 4.のようなネットワークプロットを見て、検討したと書いてある。ノードとは、単に、治療薬の名前と言う こと。Nonadは、抗うつ剤以外の全ての介入なので何でもありだ。ノードの大きさが参加者数で線の太さが研究数は、一般的である。 また、 unrelated mean effects model (inconsistency modelとも言う)というモデルを使ったとかもあるが、あまり気にしなくて良い だろう。後は、ネットワークの形があまりにもバラバラでないことをチェックしたという感じなことが書いてある。 ネットワークプロットによりネットワーク接続性を調べた。ネットワークプロットでは、治療のみのモデルの場合、ノードは各介入を 表す。治療用量モデルでは、抗うつ薬のノードは、抗うつ薬と用量(低用量、標準、高用量)を表す。ノードの色は抗うつ薬クラスを 表し、「nonad」ラベルは抗うつ薬でないすべての介入を意味する。各ノードのサイズは、その介入を調査したすべての研究からの参 加者の合計サンプルサイズを表し、線の太さはその比較のための研究数を表す。フォレストプロットは、ネットワーク内の各介入の推 定値と信頼区間を、プラセボを基準(参照比較)として示している。 続く
続き 各パラメーターの潜在的なスケール減少係数を用いて収束性を評価し、有効サンプルサイズが十分 に大きいことを確認し(Vehtari 2021)、発散遷移がないことを検証した(Betancourt 2015)。ネット ワークの形状が十分な連結性を可能にする場合、治療、治療-用量、クラス、バイアスリスク、条件の連結 ネットワークを適合させて異質性を検討した(Dias 2013)。各パラメーターの潜在的なスケールダウン係 数を用いて収束性を評価し、有効なサンプルサイズが十分に大きいことを確認し(Vehtari 2021)、分岐 遷移がないことを検証した(Betancourt 2015)。ネットワークの形状が十分な連結性を許す場合、治療、 治療-用量、クラス、偏りのリスク、条件について連結ネットワークを適合させて異質性を探った(Dias 2013)。平均残留偏差を使用してモデルの適合性を評価し、ネットワーク形状が許す限り、unrelated mean-eFect models(UME)およびノード分割によって矛盾を探索した(Dias 2013a)。各モデルから の残留デビアンス寄与を比較するdev-devプロットを使用して、矛盾を探索した。線上の点はどちらのモ デルでも同じように適合し、線の上または下の点は2つのモデルのどちらかでより適合することを示してい る(Phillippo 2022年)。 ここでノード分割という記載があるが、このノードは、ネットワーク推定値を直接比較の分と間接比較の 分に分けたという意味で、直前までのノードとは、少し意味が異なっている。これも、NMAでは普通に行 われること。 ノード分割プロットでは、直接、間接、複合のエビデンスを同じプロットで表示し、比較を可能にした。 GRADEハンドブックに従って、エビデンスの確実性を評価したとある。また、 cumulative posterior ranks も行ったとあるが、これは、このハンドブックに記載がない、よって、この時点では何を言ってい るか不明。結果でわかるかも。 GRADE(Schünemann2013)を用いたエビデンスの強さの評価とともに、効果推定値と効果の累積事後 順位を報告した。 Schünemann2013:GRADEハンドブック https://gdt.gradepro.org/app/handbook/handbook.html
治療法で、どれが一番効果があったかを、統計学的に検出する方法の一つが、SUCRAと いう方法で、そのグラフの面積が大きいほど順位が高くなる(後で解説)。 治療法の相対効果および平均順位を報告し、各アウトカムに対する異なる治療法の順位 範囲を示すthe surface under the cumulative ranking curve (SUCRA)をプロットし た。 治療のみとか、治療後のみとか、術前後の差とか、いろいろの報告型式があったので、 それらが似通った報告をしているかを、DICという情報基準という統計手法を用いて、 確認したとある。 DIC(偏差情報量規準)を用いて、異なる報告モデル(治療のみ、治療量、クラスと、 変化スコア、介入後研究の対比モデル)を比較し、そのパースモニーを評価することが できた。DICに実質的な差がある(5以上)、またはDICはわずかに低いがTauが低く、 残留偏差が3以上の研究が少ないモデルの組み合わせは優れていると判断した。我々は、 パーシモン、矛盾の最小化(UMEとノード分割モデルで特定)、残留偏差、異質性 (Tauとして測定)に基づき、報告するモデルを選択した。このアプローチは、結果の 臨床的探求とオーバーフィッティングのリスクのバランスをとるものである(Dias 2013)。NMA、UME、ノード分割モデルは、R(バージョン4-1.3)のmultinmaで実 装した。モデリングフレームワークの更なる詳細は、Phillippo 2018; Phillippo 2022 によって記述されている。
サブグループ解析と異質性の検討 サブグループ解析は、異質性がある場合の原因となるかを評価するので、再度、異質性がでてくる。 以下のサブグループ解析と行ったとあり、また、データが少なくて、できなかったサブグループが 記載されている。 データが許す限り、以下の因子についてサブグループ解析を実施した。 - 抗うつ薬のクラス(SSRI、SNRI、TCA、MAOI、その他)。痛みの状態の種類 データに予想される異質性とばらつきを考慮するために、ベイズ型ランダムエフェクターNMAを使 用した。これらの方法によって、研究間の分散要素に内在する不確実性を、効果推定精度に反映さ せることができた。 これらのサブグループ解析は、別々のモデルを構築して行いましたが、これはネットワークの形状 や接続性に依存します。 データの希少性から、以下の因子については、いずれのアウトカムにおいてもサブグループ分析を 行うことができなかった。 - 研究の目的(例.介入対象が痛みか気分か) ◦気分への対応を主目的とした研究は1件のみ(Richards 2015) - ベースラインのうつ病レベル(各測定基準で定義された、なし、軽度、中度、高度) ◦ 診察の結果、最もよく使われる5つの尺度(BeckDepression Inventory、Brief Pain Inventory Mood Item、SF-36 Mental Component Score、SF-36 Mental Health Subscale、 Hamilton Depression Rating Scale)の平均点は、すべてnone/minimalの範囲であった。
感度分析 近年、基本的に、バイアスのリスクが高いものと低いもので別に解析して、 同じ結果かなどを、チェックする感度分析を行うのが一般的になってきた ので、それを行ったとある。 バイアスリスク判定(高い、高くない)で分析できたのは、実質的な疼痛 緩和のみであった。また、活性プラセボと不活性プラセボを比較した結果、 活性プラセボを使用した研究が9件しかなかったため、感度分析を行うこ とができなかった。
エビデンスの確実性 NMAの確実性を評価するために、主にCINeMAフレームワーク(Nikolakopoulou 2020)を使用した(次で解説)。 ベイズの枠組みで実施された本レビューのNMAとは対照的に、CINeMAはRのnetmeta パッケージ(Rücker 2017)を用いたfrequentist framework内で動作する。CINeMA のフレームワークは、NMA内の特定の問題が、結果からなされる臨床的意思決定に与え る影響を考慮するものである。このフレームワークはGRADEをベースとしており、 NMAに特有の以下の6つの領域を考慮する(Nikolakopoulou 2020)。 • Within-study bias(いわゆる、リスクオブバイアス) • Reporting bias(出版バイアス・報告バイアス) • Indirectness(非直接性) • Imprecision(不精確さ) • Heterogeneity(異質性・非一貫性) • Incoherence(NMAでは、これが増えて、非推移性) 以上より、high certainty, moderate certainty, low certainty, very low certaintyと評価した。 また、CINeMAを使用できないアウトカム(有害事象、重篤な有害事象、離脱)につい ては、GRADEを使用しました。
NMAでのエビデンスの確実性について NMAでの(効果推定値の)エビデンスの確実性の評価は、2通りが多く使われている。 • GRADEアプローチによる、直接比較を重要視した方法 • GRADEアプローチから派生して、ネットワーク全体を重視した、CINeMAという方法 コクランでも、この2つのどちらが良いとかの結論はでていない。どちらも、「高・中程度・低・非常に 低」と分類。抄録にわざわざ記載されているROB-MENは、 CINeMAで使うツールの一つであり、気にしな くて良い。 また、治療の順位も、以下の違いがある。 • GRADEアプローチでは、エビデンスの確実性と効果推定値の大きさを順に並べて色分けして、見やす い表として検討する • CINeMAでは、the surface under the cumulative ranking curve (SUCRA)というランキング(面積 が大きい順)を統計手法で算出する ここで、注意が必要なのは、SUCRAというランキングの確実性については、上の(効果推定値の)エビデ ンスの確実性とは別に評価しなければならない。ランキングに確実性がなければ、ランキングは使えない。 どうも、この論文では、ランキングの確実性の評価は、少ししかされてないようだ。と言うことは、ランキ ングは信用できないかもしれない。 また、「CINeMAを使用できないアウトカムについては、GRADEを使用しました」とあるが、これは、上の GRADEアプローチのNMAのエビデンスの確実性の評価をおこなったのでなく、普通の2群比較のメタ分析の GRADEアプローチでエビデンスの確実性を評価したといいうだけの事である。
まとめ方 分析の規模が大きいため、抗うつ薬を投与した参加者の合計が200人以上 である抗うつ薬のみを記述と所見表の要約( summary of findings tables・SoF表)に含めました。 この決定は、最終的な結果と結論の品質と確実性を確保するために行った。 この決定は、疼痛研究のエビデンスの階層(Tier 2では少なくとも200人 の参加者のデータを使用する)を参照することで行った。
結果
Results of the search 最終的に、169論文を組 み込んだ。
含まれた論文 • • • • • • • • • • • 59 studies included fibromyalgia 49 studies included neuropathic pain 40 studies included musculoskeletal pain Nine studies included primary pain syndromes (not including fibromyalgia) that is, described only as 'somatoform' or 'idiopathic' pain Six studies included gastrointestinal pain Four studies included non-cardiac chest pain Two studies included burning mouth syndrome Two studies included visceral pain One study included atypical facial pain One study included phantom limb pain One study included pelvic pain • Amitriptyline: 1843 (43 studies) • Bupropion: 54 (1 study) • Citalopram: 97 (5 studies) • Clomipramine: 124 (2 studies) • Desipramine: 336 (7 studies) • Desvenlafaxine: 884 (2 studies) • • • • • Dothiepin: 55 (3 studies) • Doxepin: 30 (2 studies) • Duloxetine: 6362 (43 studies) • Escitalopram: 93 (3 studies) • Esreboxetine: 978 (2 studies) • • • • Fluoxetine: 277 (11 studies) • Imipramine: 300 (7 studies) • Maprotiline: 135 (4 studies) • Mianserin: 107 (2 studies) • • • Milnacipran: 3110 (18 studies) • Mirtazapine: 255 (2 studies) • Moclobemide: 42 (1 study) • • • Nortriptyline: 374 (7 studies) • Paroxetine: 422 (9 studies) • Pirlindole: 50 (1 study) • Reboxetine: 18 (1 study) • Sertraline: 91 (3 studies) • Trazodone: 63 (3 studies) • Trimipramine: 18 (1 study) • Venlafaxine: 489 (8 studies) • Zimeldine: 10 (1 study • Antidepressant versus placebo (83 studies, e.g. Hudson 2021) Antidepressant versus active comparator (22 studies, e.g. Enomoto 2018) Antidepressant versus the same antidepressant at diFerent doses versus placebo (17 studies, e.g. Arnold 2012b) Antidepressant versus active comparator versus combined antidepressant + active comparator (13 studies, e.g. Ang 2013) Antidepressant versus active comparator versus placebo (9 studies, e.g. Rowbotham 2012) Antidepressant versus diFerent antidepressant (9 studies, e.g. Kaur 2011) Antidepressant versus active comparator versus combined antidepressant + active comparator versus placebo (8 studies, e.g. Gilron 2016) Antidepressant versus diFerent antidepressant versus placebo (7 studies, e.g. Heymann 2001) Antidepressant versus diFerent antidepressant versus active comparator (4 studies, e.g. Boyle 2012) Antidepressant versus the same antidepressant at diFerent doses (2 studies, e.g. Chappell 2009a) Antidepressant versus same antidepressants at diFerent doses versus diFerent antidepressant versus diFerent antidepressant at diFerent doses versus placebo (1 study, Atkinson 2007) Antidepressant versus diFerent antidepressant versus combined antidepressants versus placebo (1 study, Goldenberg 1996)
除外論文 We excluded a total of 655 references with reasons throughout the course of this review. The main reasons for exclusion were as follows. • Duplicate records (including trial registrations): 144 records • Not chronic pain condition: 71 records • Not accessible (primarily conference abstracts): 92 records • Pooled analysis: 50 records • Open-label: 42 records • Fewer than 10 participants per arm: 22 records • Single-blind: 15 records • Washout period not more than five lengths of antidepressant half-life: 1
Risk of bias
Risk of bias 以下について、解説があるが、169論文のまとめなので、さすがに、まと め、だけとなるだろう。 Allocation・Blinding・Incomplete outcome data・Selective reporting・Other potential sources of bias
Substantial pain relief (50% reduction)50%減少のカットオフで分けた2値変数 実質的な疼痛緩和のための治療用量ネットワークは、異質性が最も少なく、矛盾の証拠 がなかったモデルであったため、報告した。 我々は、42のRCTを対象とし、合計14,626人の参加者を得た(研究の範囲は47から 1108まで)。 25の異なる介入があり、いくつかの比較は、1つの研究からの直接的な証拠によっての み知らされた。 表2(p429)は、解析に含まれる各抗うつ薬の用量に関するRCTの数と参加者の総数を 示している。ネットワークが切断されたため、2つの研究のデータを含めることができ なかった。残差devianceと収束診断に基づくモデルの適合性に関して懸念はなかった ( There were no concerns regarding model fit based on residual deviance and convergence diagnostics. よくわからないが、どもかくモデルの適合は良かったとい うこと)。ネットワーク図は図4に、フォレストプロットは図5に示す。 表2:抜粋 Treatment RCTs Participants Desvenlafaxine high dose Duloxetine low dose Duloxetine standard dose Duloxetine high dose Esreboxetine standard dose Esreboxetine high dose Milnacipran standard dose 2 6 15 14 1 1 2 655 593 2429 1837 553 280 644
実質的な鎮痛効果で上位にランクされた抗うつ薬を表 3 に示す。p430 Table 3. Top-ranked antidepressants for substantial pain relie Antidepressant Credible intervals 2.5% 97.5% Odds ratio Mean rank Duloxetine standard dose 1.91 (1.69 to 2.17) 8.3 5 12 Duloxetine high dose 1.91 (1.66 to 2.21) 8.5 5 12 Milnacipran high dose 1.64 (1.04 to 2.58) 10.9 4 19 Esreboxetine standard dose 1.72 (1.13 to 2.62) 11 4 19 Milnacipran standard dose 1.65 (1.28 to 2.13) 11.8 6 18 Mirtazapine standard dose 1.30 (0.79 to 2.15) 15.4 6 21 Duloxetine low dose 1.71 (1.36 to 2.20) 15.7 11 20 Esreboxetine high dose 1.29 (0.79 to 2.11) 15.7 7 22 Desvenlafaxine high dose 1.19 (0.83 to 1.70) 16.8 11 21 CI: confidence interval Credible intervals:信用区間
SUCRA (Surface Under the Cumulative Ranking Curves) 日本語だが、難解な解説がある。 https://info.zanet.biz/?p=885 累積順位曲線下面積は、それぞれの治療について累積順位確率を縦軸に順位を横軸にして描かれる曲線下の面積になる。しか し、ややこしいのが、 mean SUCRAと書かれていると、面積だから数字が大きい順だが、mean rankと書かれているとラン キング順で、数字の小さい順。これには、それと信用区間の4分位数(2.5% and 97.5%)が記載されているが、この記載が 必須ではなさそう。 それよりも重要なのは、各ペアに対するエビデンスの確実性と、ランキング自体のエビデンスの確実性は異なり(下図を参 照)、今回のランキングには、ランキング自体のエビデンスの確実性が評価されてない。ただし、unrelated mean-effect models and node-splittingがinconsistency(たぶん、Incoherence(非整合性)の事)を示した場合は、信頼できる治療順 位でないので、ランキングしてないことより、ランキングがあるものは、ある程度の確実性があるという見解である。
まず、この解析は、基本的にプラセボとの比較での効果推定値やランキングである。そしてランキングはあまり信 用できないが、確かにORの95%CIの下限もかなり大きいので、臨床的に意味がありそうな感じである。 デュロキセチン標準用量およびデュロキセチン高用量は、実質的な疼痛緩和をもたらす抗うつ薬の上位に位置し、 プラセボと比較して同等の有効性を示した(それぞれOR 1.91, 95% CI 1.69~2.17, OR 1.91, 95% CI 1.66~ 2.21, )。 ミルナシプラン高用量(OR 1.64, 95%CI 1.04~2.58) とエスレボセチン標準用量(OR 1.72, 95%CI 1.13~ 2.62) も同等であったが、デュロキセチン標準用量、デュロキセチン高用量に比べ効果は低かった。 有意差について述べるのは、本来は良くなくて、OR=1を効果があるないと判断するならば(最小臨床差より小さ い値になるが)、95%CIがまたぐということ。 ミルタザピン標準用量、エスレボキセチン高用量、デスベンラファキシン高用量は、プラセボと比較して有意差は 認められなかった。 視覚的に表現したものが、何か不明です。Table3のことかもしれないが、普通の表だが。 解析に含まれる各治療法の累積順位を視覚的に表現したもので、相対効果や平均順位信頼区間の解釈を大きく変え るものではありませんでした。 unrelated mean-effect modelは、inconsistency modelとも言うから、このような文章になる。 unrelated mean-effect modelは、用量-治療モデルと同様のdeviance情報基準を持ち、inconsistencyを示す証拠 はなかった。 直接比較と間接比較で、矛盾があるかをみるのは、NMA推定値を直接と間接にわかるというノード分割というのを 行って、検討しますので、それらについて書かれていると思われる。これらの図は、補足ファイルとで、Table3の p430以降を見ると、Tableしかなく、Figureがないぞ? 直接証拠と間接証拠を比較することが可能な9つの比較すべてについて、ノードスプリッティングモデルで確認し た。プレガバリンとプラセボの比較では、ベイズP値が最も小さく(P = 0.3)、単一研究に基づくプレガバリンの 効果の過小評価を示唆する直接証拠がある場合、inconsistencyがあることを示す。これらの図は、補足ファイルに 掲載されています。一貫したエビデンスネットワークがあるため、感度違反の調査は必要なかった。
Imprecision・Incoherence 注意:直接比較と間接比較で、矛盾があるかをみるのは、 incoherence(非整合性)とよばれるが、inconsistency(一般的 には非一貫性で、heterogeneityのこと)と表現する先生もいる。 たぶん、本文の他の部分より、この論文では、 incoherenceのこ とを、 inconsistencyとしていると推察された。詳細には、p20に incoherence定義があったが、 inconsistency の定義はなかった。 Incoherence(直接証拠と間接証拠の結果の一致) ◦ ネットワーク内の直接証拠と間接証拠のばらつきであり、 Transitivityの評価でもある。CINeMAは、直接推定と間接推定の 推定値の95%CIを比較します。これらの推定値がともに臨床的同 等性の範囲の同じ側にある場合、 incoherenceに関する懸念はあ りません。
Figure 4. Substantial pain relief network plot. NASSA: noradrenergic and specific serotonergic antidepressants(ノルアドレナリン作動性・特異的セロトニン作動性抗うつ薬) SNRI: serotonin noradrenalin reuptake inhibitors(セロトニン・ノルアドレナリン再取り込み阻害剤; 総称名:デュロキセチン; 一般名:デュ ロキセチン塩酸塩;) SSRI: selective serotonin reuptake inhibitors(選択式セロトニン再取り込み阻害薬) TCA: tricyclic antidepressants三環系抗うつ薬(総称名:トリプタノール; 一般名:アミトリプチリン塩酸塩) nonad: non-antidepressants
Figure 5. Substantial pain relief forest plot (log odds ratio with credible intervals) 方法にプラセボが参照比較とある・ Log ORに注意。 Fig4と治療薬のグループの色が違うようだが? ここには、エビデンスの確実性が書かれてないので、このフォレストプロットだけで判断してはいけない。
TCA三環系抗うつ薬のネットワークを見てみよう たとえば、TCAは、症例数も研究数も少なく(○が小さ く線が細い)、かつ、プラセボとの直接比較もない(点 線のところ)ものがあることがわかる。 また、症例数の多い、duloxetineとの直接比較がほと んどない。 よって、エビデンスの確実性は低そうな雰囲気がある。
TCAの効果推定値は、下の2つは、他 より比較的大きい。 しかし、duloxetine highなどのプロット と比較すると、95%信用区間が広い ことがわかる。たぶん、不精確だろう。
Heterogeneity・Class・ Condition(これは順番を後で) 補足ファイルのどこか不明だった。 オーバーフィットover-fittingのリスクはあるが、患者、臨床医、そして生 活の質全体にとってのアウトカムとしての実質的な痛みの重要性から、複 数のモデルの結果を要約することにした。すべてのモデルの完全な結果は、 補足ファイルに報告されている。 個別の薬剤・容量の違いをまとめて、4つに分類して、NMAを行った。こ の4つで差があるかを見たかったが、inconsistency(非整合性)と信頼区 間が重なっていたので、この4つに差があるとは言えなかったということ。 治療法をクラスに集約してネットワークを作成した。分析対象は4つの抗 うつ薬クラスである: SNRI、TCA、TeCA、NaSSAの4つの抗うつ薬クラ スが含まれるが、inconsistencyや信頼区間の重複のため、クラスの違いに ついて信頼できる結論を出すことはできなかった。
バイアスのリスク・CINeMA バイアスのリスクが高い研究を削除した場合の影響を調べるため、感度分析を行った。その結果、 15件の研究がバイアスのリスクが低いと評価された。 結果として得られたネットワークのモデルは不安定で、モデルの収束に問題があることを示す発散 遷移が見られた。unrelated mean-effect modelやdev-dev plot( 2種類のモデルの偏差を比較し てプロットする方法で、モデル間で不整合性があるかをみる)では不整合性は確認されなかったが、 ネットワーク形状のためノード分割では確認することができなかった。結果は、治療用量モデルと 一致していた。 抗うつ薬の順位は、エスレボセチン(平均順位=3.73、97.5%信頼区間=2~7)、デュロキセチン (平均順位=4.64、97.5%信頼区間=3~6)の2つが最高順位であった。 heterogeneityを探るために複数のモデルを当てはめ、 inconsistencyを探るためにunrelated mean-effect modelとノード分割モデルを利用したことに加え、CINeMAによるエビデンス強度の 評価を容易にするために、一対の直接エビデンスとネットワークエビデンス(用量に関するマルチ アーム試験を除く)をさらに分析した。 design-by-treatmentテスト(設計ごとの治療相互作用モデルの変量効果を使用て関心のあるパラ メーターを推定するということだが、これでもわからない、ともかく、incoherence(非整合性) を評価する方法、本論文では、 inconsistency と表現)では、直接エビデンスと間接エビデンスの 間に矛盾はなかったが(Chi 2 = 14.069, P = 0.296)、duloxetine low doseとdesvenlafaxine high doseは、heterogeneity(異質性)を示す高いI2統計値(73.6%、65.8%)を有していた。 デュロキセチン低用量、標準用量、高用量については、中程度の確実性があると評価した。その他 の抗うつ薬の用量は、バイアスリスクの高い研究、不正確さ(推定値がゼロになる)、そして少量 であるという大きな懸念から、確実性が低い、または非常に低いと評価した。
Summary of findings さて、ここまで見ると、Summary of findings が読めるようになる。 効果推定値の95%CIの下限も、プラセボに対して1000人中100人の増加で、 エビデンスの確実性は中等度、さらにランキングはあくまでも参考だが、ラ ンキングが高かったのが、 デュロキセチン標準用量およびデュロキセチン高用量であったと読めるだろ う。著者らは、「equally efficacious in comparison to placebo」と評価し ているが、効果があると思われる。 残念ながら、よく使われる? TCA: tricyclic antidepressants三環系抗うつ 薬(総称名:トリプタノール; 一般名:アミトリプチリン塩酸塩)は、途中から、 参加者の合計が200人以上いないため、はぶかれて、SoF表にも記載がないこ とを念頭に、SoF表を見てみよう。・・・よって、エビデンスの確実性すら不明 である。書いておいてよ~。
Summary of findings 1. Substantial pain relief summary of findings
Estimates of effects, credible intervals, and certainty of the evidence for substantial pain relief in people with chronic pa in
Bayesian network meta-analysis summary of findings table
Patient or population: people with chronic pain
Interventions: desvenlafaxine high dose (≥ 50 mg); duloxetine low dose (< 60 mg), standard dose (60 mg), and high dose (> 60 mg);
esreboxetine standard dose (4-8 mg) and high dose (≥ 8 mg); milnacipran standard dose (100 mg) and high dose (> 100 mg);
mirtazapine standard dose (30 mg)
Comparator (reference): placebo
Outcome: substantial pain relief (≥ 50% reduction in pain intensity from baseline) as measured on various scales including 0 -10 VAS, 0100 VAS, and the Brief Pain Inventory
Direction: higher is better (i.e. more people reporting substantial pain relief)
Network meta-analysis-summary of findings table definitions
*Anticipated absolute effect. Anticipated absolute effect compares 2 risks by calculating the difference between the risk of the intervention
group with the risk of the control group.(予想される絶対効果とは、介入群のリスクと対照群のリスクの差を計算することで、2つのリスクを比較す
るものである)(計算式は、Absolute Risk Difference: ((ORpredictor * Baseline risk)/ ((1-Baseline risk) + (ORpredictor * Baseline risk))) - Baseline
risk)
** Mean rank and credible intervals are presented.
CI: confidence interval; CINeMA: Confidence in Network Meta-Analysis; NNTB: number needed to treat for an additional beneficial outcome(有
益なアウトカムを追加で治療するために必要な数、なので、NNTと同じで良い、harmfulなら、NNTHとなる); OR: odds ratio; RCT: randmised
controlled trial; VAS: visual analogue scale(ベイズの解析では、95%信頼区間でなく、信用区間(credible interval )なので、なぜconfidence interval
となっているのか不明?)
The number of participants for each antidepressant reflects the total number of participants taking the antidepressant or placebo from the
studies in the network meta-analysis.(各抗うつ薬の参加者数は、ネットワーク・メタアナリシスの研究から抗うつ薬またはプラセボを服用した参加
者の総数を反映したものである。)
CINeMA grades of confidence in the evidence
High: further research is unlikely to change our confidence in the estimate of effect.
Moderate: further research is likely to have an important impact on our confidence in the estimate of effect and may change the estimate.
Low: further research is very likely to have an important impact on our confidence in the estimate of effect and is likely to change the estimate.
Very low: we are very uncertain about the estimate.
To t al studies: 42 R e lative effect To t al participants: 14,626 (O R and 95%CI) With placebo With in tervention Difference 1.91 592/2061 1058/2429 1 48 more per 1000 (1.69 to 2.17) 287 per 1000 435 per 1000 1 18 to 176 Du loxetine standard dose RCTs: 16 Participants: 4490 Du loxetine high dose RCTs: 14 Participants: 3692 Milnacipran high dose RCTs: 1 An ticipated absolute effect (event rate)* 1.91 431/1855 674/1837 1 34 more per 1000 (1.66 to 2.21) 232 per 1000 366 per 1000 1 02 to 168 1.64 38/145 88/239 1 06 more per 1000 (1.04 to 2.58) 262 per 1000 Certainty of the R anking**(2.5% to e vidence 9 7 .5% credible (CI NeMA) in terval) Moderate,a 8 I n terpretation of findings Equivalent to NNTB of 7.1 (5 to 12) 8 Moderate,a (5 to 12) 11 Very lowa,b 368 per 1000 (4 to 19) Equivalent to NNTB of 7.4 Equivalent to NNTB of 9.4 Participants: 384 Esreboxetine standard dose RCTs: 1 Participants: 828 Milnacipran standard dose RCTs: 2 Participants: 1298 Mir tazapine standard dose RCTs: 1 Participants: 422 Du loxetine low dose RCTs: 6 Participants: 1116 Esreboxetine high dose RCTs: 1 Participants: 555 De svenlafaxine high dose RCTs: 2 Participants: 870 1.72 33/275 105/553 7 0 more per 1000 (1.13 to 2.62) 120 per 1000 190 per 1000 1 3 to 143 1.65 130/654 187/644 9 1 more per 1000 (1.28 to 2.13) 199 per 1000 290 per 1000 4 2 to 147 1.3 33/211 41/211 3 9 more per 1000 (0.79 to 2.15) 156 per 1000 194 per 1000 - 29 to 128 1.71 150/523 242/593 1 20 more per 1000 (1.36 to 2.20) 287 per 1000 407 per 1000 6 7 to 183 3 0 more per 1000 1.29 33/275 42/280 (0.79 to 2.11) 120 per 1000 150 per 1000 1.19 51/215 177/655 (0.83 to 1.70) 237 per 1000 270 per 1000 Low,a 11 Equivalent to NNTB of 14 (4 to 19) Low,a,c 12 Equivalent to NNTB of 11 (6 to 18) Low,e 15 (6 to 21) Moderate,,a,b,c 16 Equivalent to NNTB of 8.3 (11 to 20) Very low,a,b 16 (7 to 22) 3 3 more per 1000 Not significantly different from placebo Very low,a,b 17 (11 to 21) Not significantly different from placebo Not significantly different from placebo aDowngraded due to within-study bias. bDowngraded due to imprecision in the estimate. cDowngraded due to heterogeneity in the estimate. dDowngraded due to incoherence in the network. eDowngraded due to a small number of trials and participants; we cannot draw reliable conclusions. 赤の絶対差の95%信頼区間は、論文に記載がなかったので計算した。 Rankingは、Table3と同じだ。
ランキングでなく、エビデンスの確実性と絶対効果の大きさで表示した (CINeMAでなくGRADEアプローチの本法に近い方法) エビデンスの確実性 効果の大きさ (95%CIの下限) 効果の大きさ (点推定値) 118 148 効果の大きさ(1000人中100人を、臨床的に効果があ るとの閾値とした(個人的な判断)) 薬剤名 Duloxetine standard dose 大きい 中等度 102 134 67 120 42 91 Duloxetine high dose 小さい Milnacipran standard dose 低 非常に低 Duloxetine low dose 僅か 13 70 -29 39 Esreboxetine standard dose 95%CIが害~100人の閾値までのため、不精確さが非常 に深刻であり、エビデンスの確実性は非常に低と判断 Mirtazapine standard dose 抗うつ薬を投与した参加者の合計が200人以上である抗うつ薬のみ プラセボが参照比較 このアウトカムの評価でも、やはり、Duloxetine標準用量およびDuloxetine高用量は、効果がある (エビデンスの確実性:中等度)となりそう。 また、Duloxetine low dose(Duloxetineと直接比較あり)・Milnacipran standard dose(直接比 較なし)・Esreboxetine standard dose (直接比較なし)とのペア比較でも効果があると、さらに 判断が容易になる。 他の患者にとって重大なアウトカムでも同様の評価なら(これは、各自で考えてね・特に害がなけ れば)、推奨できそうだ。
Condition・病態 研究では、神経障害性疼痛neuropathic 、線維筋痛症fibromyalgia 、筋骨格系疼痛 musculoskeletal 、原発性疼痛primary 、および消化器系疼痛症状gastrointestinal pain conditionsを含む、実質的な疼痛( substantial pain)が報告されました。 ただし、神経障害性疼痛および線維筋痛症の疼痛症状のみが関連ネットワークを持って いました。 神経障害性疼痛は、ランキングがないとだけで、サブグループの結果は、まったく示さ れてなかった。 神経障害性疼痛に関しては、unrelated mean-effect models and node-splittingが inconsistency(たぶん、Incoherence(非整合性)の事)を示したため、信頼できる 治療順位を導出することができませんでした。 線維筋痛症に対しても、ランキングの平均ランクの値が本文にあるのみで、効果推定値 も記載がなかった。 線維筋痛症については、ネットワークの形状が一貫性の分析を妨げましたが、エスレボ キセチン、ミルナシプラン、およびドゥロキセチンは比較的同等にランク付けされまし た。エスレボキセチン(平均順位= 2.02、97.5%信用区間= 1から4);ミルナシプラ ン(平均= 2.30、97.5%信用区間= 1から4);ドゥロキセチン(2.48、97.5%信用区 間= 1から4)。
小括 本解析は、あくまでも、神経障害性疼痛neuropathic 、線維筋痛症 fibromyalgia 、筋骨格系疼痛musculoskeletal 、原発性疼痛 primary 、および消化器系疼痛症状gastrointestinal pain conditions を含む慢性疼痛の人people with chronic painである。 当初の懸念の、違う病態を一緒に検討している。この分野では、これ で許されるのか、専門家の意見を聞きたいところではあるが、残念感 は拭えない。 また、デュロキセチン標準用量およびデュロキセチン高用量のエビデ ンスの確実性は中等度であったが、アミトリプチリンは、ランキング 外として、評価できるエビデンスがなかったとしているので、エビデ ンスの確実性や効果推定値不明(フォレストプロットに僅かあるが) となった。
それ以降 それ以降は、基本的に、同じように、NMAの記載がある。 また、p88-p401は、Characteristics of included studiesであり、もし、 採用論文の内容を知りたいときに見るが、そもそも、どの論文が、どの解 析に使われたのかが、直接比較の普通のメタ分析のフォレストプロットな どが、まったく無い事より、この表に戻るのは、なかなか困難である。 また、総当たりのリーグテーブルがないため、あくまでもプラセボとの比 較の効果推定値しか不明であり、薬剤間の比較を知りたくても、わからな い(ネットワーク図より、確実性が低そうなので、役にたたないかもしれ ないが、少しは知りたかった気もする)。