ネットワークメタ分析の論文の図表の理解しよう：慢性疼痛患者と抗うつ剤P34まで

1.

ネットワークメタ分析の論文の図表の理解しよう（コクランが公開まで非公開編）：慢性疼痛患者と抗うつ剤P34まで Antidepressants for pain management in adults with chronic pain: a network meta-analysis 成人の慢性疼痛患者における疼痛管理のための抗うつ薬：ネットワークメタ解析 https://www.cochranelibrary.com/cdsr/doi/10.1002/146 51858.CD014682.pub2/full DeepL翻訳利用

https://www.cochranelibrary.com/cdsr/doi/10.1002/146

2.

サマリー・緒言など

3.

Abstract 背景慢性疼痛は成人に多い。これまでのレビューでは、特定の抗うつ薬が痛みの軽減に有効であり、特定の慢性疼痛状態において患者の変化に対する全体的な印象を改善することに一定の効果があることが示されている。目的成人の慢性疼痛（頭痛を除く）に対する抗うつ薬の比較有効性と安全性を評価すること。検索方法 CENTRAL、MEDLINE、Embase、CINAHL、LILACS、AMED、PsycINFOデータベース、および臨床試験登録から、2022年1月に慢性疼痛疾患に対する抗うつ薬の無作為化対照試験（RCT）を検索した。選択基準慢性疼痛に対する抗うつ薬を任意の比較対象に対して検討したRCTを対象とした。比較対象がプラセボ、他の薬、他の抗うつ薬、または同じ抗うつ薬を異なる用量で投与するものであれば、ダブルブラインドとした。ダブルブラインドできないアクティブコンパレータを持つRCT（例：心理療法）も含めたが、バイアスの危険性が高いと評価した。追跡期間が2週間未満のRCTや、各群の参加者が10人未満のRCTは除外した。データ収集と分析 2名のレビュー著者が別々にスクリーニングを行い、データを抽出し、バイアスのリスクを判断した。各アウトカムについてベイズNMA とペアワイズメタ解析を用いてデータを統合し、累積順位曲線下表面（SUCRA）を用いて抗うつ薬を有効性の観点からランク付けした（後に解説）。エビデンスの確実性を評価するために、主にConfidence in Meta-Analysis（CINeMA）・ROB-MENを用いた（後に解説）。ネットワークの複雑さによりCINeMAを使用できない場合は、GRADEを用いてエビデンスの確実性を評価した。アウトカム主要アウトカム：実質的な（50％）疼痛緩和、疼痛強度、気分、有害事象とした。副次的アウトカム：中等度の疼痛緩和（30％）、身体機能、睡眠、QOL、Patient Global Impression of Change（PGIC）、重篤な有害事象、離脱であった。

4.

Abstract 主な結果本レビューでは、176の研究、合計28,664人の参加者を対象とした。研究の大半はプラセボ対照（83件）、並行群（141件）であった。最も一般的な疼痛疾患は、線維筋痛症（59試験）、神経障害性疼痛（49試験）、筋骨格痛（40試験）であった。 RCTの平均期間は10週間であった。7件の研究は使用可能なデータを提供しなかったため、NMAから除外された。大半の研究は、短期的なアウトカムのみを測定し、低気分や他の精神衛生状態の人々を除外した。有効性のアウトカム全体において、デュロキセチンは中程度～高の確実性のエビデンスを有する抗うつ薬として一貫して最も高いランクに位置づけられた。デュロキセチンの研究では、ほとんどのアウトカムにおいて、標準用量は高用量と同等の有効性を示した。ミルナシプランは、エビデンスの確実性はデュロキセチンよりも低かったが、次に有効な抗うつ薬としてしばしばランク付けされた。慢性疼痛に対する他の抗うつ薬の有効性と安全性については、強固な結論を導き出すには十分な証拠がなかった。有効性の主要アウトカムデュロキセチン標準用量（60mg）は、実質的な疼痛緩和（オッズ比（OR）1.91、95％信頼区間（CI）1.69～ 2.17；16試験、4490人；中程度の確実性）および連続した疼痛強度（標準化平均差（SMD）-0.31、95％CI 0.39～-0.24；18 試験、4959人；中程度の確実性）において小規模から中規模の効果を見せた。痛みの強さについては、ミルナシプラン標準用量（100mg）も小さな効果を示した（SMD -0.22, 95% CI -0.39 to 0.06; 4 studies, 1866 participants; moderate-certainty evidence）。ミルタザピン（30mg）は、気分に対して中程度の効果を示し（SMD -0.5, 95% CI -0.78 to -0.22; 1研究、406人; 低の確実性）、デュロキセチンは小さな効果を示した（SMD -0.16, 95% CI -0.22 to -0. 1;26の研究、7952人の参加者、中程度の確実性）；しかし、ほとんどの研究が精神衛生状態の参加者を除外しているため、平均不安および抑うつスコアは、ベースラインですでに「正常」または「不顕性」の範囲にある傾向があることに注意することは重要である。

5.

気になったこと？（この分野、詳しくないので間違いかも）「最も一般的な疼痛疾患は、線維筋痛症（59試験）、神経障害性疼痛（49試験）、筋骨格痛（40試験）であった。」えっ、この分野、これらの違う病態を、一緒にして良いの？本文には、分けて解析しているのかな～。気になるので、気にしつつ読んでみよう。

6.

Abstract セカンダリーアウトカムすべてのセカンダリーアウトカム（中等度疼痛緩和、身体機能、睡眠、QOL、PGIC）において、デュロキセチンとミルナシプランは、効果は小さいものの、中程度の確実性を有するエビデンスで、最も上位の抗うつ剤となった。デュロキセチン、ミルナシプランともに、標準用量は高用量と同程度の効果があった。安全性すべての抗うつ薬において、すべての安全性アウトカム（有害事象、重篤な有害事象、離脱）について、非常に低い確実性であった。これらの結果について、NMAから信頼できる結論を導き出すことはできない。著者らの結論我々のレビューとNMAは、25種類の抗うつ薬を調査した研究にもかかわらず、慢性疼痛治療において我々が確信している唯一の抗うつ薬はデュロキセチンであることを示している。デュロキセチンは、標準用量ですべてのアウトカムにおいて中程度の有効性を示した。また、milnacipranには有望なエビデンスがあるが、これらの結論に自信を持つためには、さらに質の高い研究が必要である。他のすべての抗うつ薬のエビデンスは、確信度が低いものであった。 RCTでは気分が低下している人が除外されているため、慢性疼痛とうつ病を有する人に対する抗うつ薬の効果を立証することはできなかった。現在、抗うつ薬の長期的な有効性に関する信頼できる証拠はなく、どの時点においても慢性疼痛に対する抗うつ薬の安全性に関する信頼できる証拠はない。

7.

はじめに背景 Description of the condition Description of the intervention How the intervention might work Why it is important to do this review 目的慢性疼痛（頭痛を除く）を有する成人患者に対する抗うつ薬の比較的な有効性と安全性を評価する。 • 慢性疼痛（頭痛を除く）のある成人に対する抗うつ薬の比較的な有効性と安全性を評価する： • 抗うつ薬の種類、クラス、用量ごとの有効性を評価する。痛み、気分、身体機能、睡眠、QOL、PGICの改善における抗うつ薬の種類、クラス、用量別の有効性を評価する。およびPGICを評価する； • 抗うつ薬の有害事象および重篤な有害事象の発生件数の評価抗うつ薬の有害事象と重篤な有害事象の数をタイプ、クラス、用量別に評価すること； • 痛み、気分、有害事象の治療における抗うつ薬の有効性をランキングする。有害事象の評価

8.

方法

9.

患者など Criteria for considering studies for this review Types of studies 基本的にRCT（抄録程度の理解で良いと思う） Types of participants 国際疼痛学会（IASP）の慢性疼痛の定義（すなわち、少なくとも3ヶ月の期間；IASP 2019）に合致する、身体のいずれかの部位（頭痛を除く）の一次または二次疼痛を主訴として報告する成人（18歳以上）を対象とした。個々の研究の包含基準に重症度が含まれているかどうかを抽出したが、参加者の慢性疼痛の重症度に関係なく、すべての研究を対象とした。参加者の主訴が頭痛や片頭痛である研究は、過去のコクランレビューで取り上げられていたため除外した（Williams 2020）。この疾患はIASP基準に適合するが、一次および二次性頭痛の診断、分類、治療は、他の疼痛疾患とは異なるものであり、臨床試験は、対症療法ではなく、さらなる頭痛や片頭痛の予防を主目的としている。慢性疼痛が臨床試験の焦点である限り、複数の健康状態を持つ参加者を対象とした。

10.

介入抗うつ薬であれば、どのような用量でも、どのような適応症でも対象としたが、主に慢性疼痛患者の治療に使用されるプラセボまたは積極的介入と比較した。薬剤の内容は、以下であったと記載（抜粋）：以下のクラスに分類される抗うつ薬 • 三環系抗うつ薬（TCA）：アミトリプチリン･･･ • 選択的セロトニン再取り込み阻害薬（SSRI）：フルボキサミン･･･ • ロトニン・ノルアドレナリン再取り込み阻害薬（SNRI）：･･････

11.

研究に組み入れた試験や介入についての補足アクティブな比較対象がある研究を対象とした。抗うつ薬と他の介入を併用する研究は、他の介入のみのアームがあり、抗うつ薬の効果を分離できる限り、対象とした（例：抗うつ薬＋薬剤対薬剤）。抗うつ薬の効果を分離する方法がない組み合わせの研究（例：抗うつ薬A＋薬物対抗うつ薬B）は含まなかった。このレビューでは、包含基準を満たした参加者は原則として、対象となる抗うつ薬のいずれかに無作為に割り付けられる可能性が等しいと仮定した；しかしながら、どの抗うつ薬を研究するかによって、患者の治療や結果に対する期待に差があったかもしれないことを認めるものである。

12.

アウトカムについて我々は、文献を通してさまざまな結果測定法が使用されることを予期していた。上述の苦痛とうつ病の区別のため、このレビューでは、診断されたうつ病、自己報告で測定された気分、苦痛を含む転帰として「気分」という用語を使用した。 Due to the distinction between distress and depression discussed above,this review used the term 'mood' as an outcome, to include depression that is diagnosed, mood that is measured via self-report, and distress. 痛みと気分については、該当する場合、臨床試験における方法、測定、痛み評価に関するイニシアチブ（IMMPACT）のガイダンスに沿って、実質的な改善を示すために、痛みの軽減または50％以上の改善にアウトカムを二分化した（Dworkin 2008）。可能であれば、介入直後、短期フォローアップ（治療後12週間以内）、長期フォローアップ（治療後12週間以上）で、抗うつ薬と比較対象薬を比較する別々のNMAを計画した。複数のフォローアップ時点を含む研究では、各期間の中で最も新しい時点を採用した。同じ結果に対して複数の尺度が使用されている場合（例えば、連続的な痛みの強さについては、0から10の数値評価スケールとMcGill Pain Questionnaire（Melzack 1975）の両方が報告されている）、その分野で最も有効で信頼でき、広く使われている尺度から抽出を行った。

13.

主要アウトカムと副二アウトカム抄録程度で良いので主要アウトカム：実質的な（50％）疼痛緩和、疼痛強度、気分、有害事象とした。 Our primary outcomes were substantial (50%) pain relief, pain intensity, mood, and adverse events. 副次的アウトカム：中等度の疼痛緩和（30％）、身体機能、睡眠、QOL、 Patient Global Impression of Change（PGIC）、重篤な有害事象、離脱であった。 Our secondary outcomes were moderate pain relief (30%), physical function, sleep, quality of life, Patient Global Impression of Change (PGIC), serious adverse events, and withdrawal.

14.

検索・研究の選択・Data extraction and management 抄録で良いでしょう。検索方法 CENTRAL、MEDLINE、Embase、CINAHL、LILACS、AMED、PsycINFOデータベース、および臨床試験登録から、2022年1月に慢性疼痛疾患に対する抗うつ薬の無作為化対照試験（RCT）を検索した。検索式は、p473のAppendix 1.Search strategies。選択基準慢性疼痛に対する抗うつ薬を任意の比較対象に対して検討したRCTを対象とした。比較対象がプラセボ、他の薬、他の抗うつ薬、または同じ抗うつ薬を異なる用量で投与するものであれば、ダブルブラインドとした。ダブルブラインドできないアクティブコンパレータを持つRCT（例：心理療法）も含めたが、バイアスの危険性が高いと評価した。追跡期間が2週間未満のRCTや、各群の参加者が10人未満のRCTは除外した。詳細は、Figure 1. PRISMA flow diagram of studies found, screened, and included。 Data extraction and management こんなデータを、論文から抽出して一覧としたよというだけで、飛ばしても良いでしょう。

15.

研究内のリスクオブバイアスの評価選択した各研究の、リスクオブバイアスは、以下の評価を行った。 Cochrane risk of bias tool（RoB 1）とのことで、最新のRoB2.0というツールでなく、古いツールだったようだ。その詳細が記載されている。このRisk of Biasと、先の、Data extraction and managementが、p88 ～p401までの恐ろしい分量の、 CHARACTERISTICS OF STUDIES Characteristics of included studies に記載がある。 Risk of Biasは、Figure 2. Risk of bias of included studies by domain とFigure 3. Risk of bias of included studies by studyにも記載あり。

16.

治療効果の測定方法連続データを測定するアウトカム（疼痛強度、気分、身体機能、睡眠、QOL、PGIC連続）：介入後のスコア（介入期間終了時の平均スコア）または変化スコア（ベースラインのスコアからの平均変化）のいずれかでデータを報告した研究があるので、別々に分析を行った。測定方法が研究間で異なるので、単なる平均差MDでは、その研究間の違いで統合できない。よって、SDでMDを割ったSMDを使うと統合できる。疼痛管理に関する研究ではよくあることだが、すべてのアウトカム（PGICを除く）において、研究者はアウトカムを測定するために幅広い尺度を使用していた。そのため、データを抽出した後、標準化平均値（SMD）と95％信頼区間（CI）に変換した。しかし、SMDでは、単位がないので、効果が大きいのか小さいのか不明である。よって、コーエンのｄという経験値を用いる。 Cohen1988とCochrane Handbook for Systematic Reviews of Interventions (Higgins 2022a)に沿って、SMDを小（0.2）、中（0.5）、大（0.8）と解釈した。相対危険度（RR)のが、わかりやすいが、NMAでは、計算の都合と、RRより統合しやすい（概説です）ので、ORを使う。ORなので、1.3でも1.3倍あったと表現してはならない。二値データ（実質的な痛みの軽減、有害事象、中程度の痛みの軽減、PGIC大いに／大いに改善、重篤な有害事象、離脱）のアウトカムについては、95％CI付きのオッズ比（OR）を用いた。

17.

分析単位の問題・欠損データへの対応各RCTで、群分けが、わかりやすかったので、普通にできたと書いてある程度。ほとんどの RCT では、参加者が異なる試験群に無作為に割り付けられたため、直接分析が可能であり、分析単位が複雑になることはなかった。クロスオーバー RCT については、クロスオーバーの影響を避けるため、最初の期間（クロスオーバー前）の結果が報告されている場合は、それを抽出した。最初の期間の結果が報告されていない場合は、抗うつ薬の半減期の5倍以上の十分な洗浄期間があれば、最終的な試験結果を抽出した（最低洗浄期間の長さは各抗うつ薬について個別に計算）。クロスオーバー試験の大半は、両期間の効果を合わせて報告していた（第1期間と第2期間の効果を別々に報告していたのは1件のみ）ので、これらの効果を合わせてクロスオーバー試験を分析した。検索では、包含基準に合致するクラスターRCTは見つからなかった。データが抜け落ちているときに、統計的に代入するので、その方法。連続変数で良くあるのが、標準偏差SDの記載がない場合。他のよく似た研究を集めて、その平均や中央値を使って体入値とすると言うことが書いてある。アウトカムに関連する研究レベルの統計データが欠落している場合、まずその研究の著者に連絡を取るようにした。著者からデータを得られない場合は、Cochrane Handbook for Systematic Reviews of Interventions (Deeks 2022)のガイダンスに従った。標準偏差が不足している場合は、Review Manager calculator (RevMan Web 2023)を使用して、研究で報告された他のデータから計算した。データのインピュートは行わず、データの欠落による各研究のバイアスリスクを評価した。

18.

Heterogeneity異質性の評価方法 GRADEアプローチでは、研究間で結果が異なると、Inconsistency非一貫性と呼んでいた。しかし、NMAでは、特に、 CINeMAを使う人（後で解説）は、Heterogeneity異質性と表現することが多い。その基準を書いてあるだけ。異質性の評価 Cochrane Handbook for Systematic Reviews of Interventions (Deeks 2022)のガイダンスに沿って、Tau統計を使ってネットワークメタ解析内の異質性を評価した。異質性の評価には、CINeMAを用い、各アウトカムに関する一対比較についてChi2testとI2統計量を算出した（Nikolakopoulou 2020）。 CochraneHandbook for Systematic Reviews of Interventionsにあるように、I2統計量を以下のように解釈した（Deeks 2022）。 - 0%から40%：重要でない可能性がある - 30%～50%：中程度の異質性を表す可能性がある - 50%～90%：相当な異質性を示す可能性がある - 75%から100%：かなりの異質性異質性を評価する際には、効果の大きさと強さを考慮した。

19.

Transitivity（推移性） Transitivityは、右図のようなこと。以下の要因について、調査した。 - 痛みの状態 - 年齢 - ベースライン時の痛みの強さ - ベースライン時のうつ病の重症度 - 治療期間、および - 投与スケジュールネットワークの間接性を評価することで、これらの要因の影響を探った。プラセボを含むこと、およびプラセボがtransitivity仮定に違反する可能性に関する懸念は、一般的に（Cipriani 2013）、特にうつ病研究において（Rutherford 2009）、強調されている。そこで、ネットワークの検証の一形態として、プラセボ対照研究とヘッド・トゥ・ヘッドのエビデンスを提供する研究を明示的に比較することにした。

20.

出版バイアス出版バイアスの評価は、このように行ったよとの記載であり、一般的な方法なので、飛ばして良い。レビューマネージャー5（Review Manager 2020）のCochrane risk of bias tool（RoB 1）を用いて、研究プロトコルと事前に指定したアウトカムを確認することで報告バイアスを評価した（「含まれる研究のバイアスリスクの評価」の項で詳述した通り）。また、10以上の研究が利用可能な抗うつ薬のペアワイズ分析には、 Cochrane Handbook for Systematic Reviews of Interventions (Page 2022)の助言に従って、ファネルプロットを用いた。ファネルプロットは、CINeMAの一部であるROB-MENを用いて作成し、ファネルプロットの非対称性によって有意な小規模研究の影響を評価するために使用した。

21.

データ統合方法・NMAの方法アウトカムごとにNMAを行った。 NMAは、こんなものですという解説 NMAは、RCT内の介入の直接比較と、共通のプラセボ比較対象に基づく研究間の間接比較の両方からの情報（エビデンス）を組み合わせる（Caldwell 2005; Jansen 2011）。直接比較（直接エビデンス）は、2つ以上の介入を試験で正面から比較した場合に発生する；正面から比較することがない場合、介入は間接的に比較することができる（間接エビデンス）。 NMAで使った統計ソフト（Rというソフトで、パッケージが、 multinma。また、NMAには、頻度論的とベイズ的の2通りがあり、今回はベイズを使った。治療薬に容量が記載ある場合は、低・標準・高と分けて、治療薬A1、A2、A3と別の薬剤として比較したなどが記載されている。 R（rproject.org）のパッケージmultinma（Phillippo 2022）を用いて実装したベイズ型ランダム効果NMAを用いて、すべての主要および副次アウトカムのデータを解析した。用量がネットワークに含まれる場合は、それらを分類し（低、標準、高）、別のノードとして組み込んだ。ある研究で、同じ抗うつ薬の異なる用量を調査する複数のアームがあり、それが同じカテゴリーに分類される場合（例えば、2種類の低用量）、それらを結合せず、multinmaパッケージを使用することにより、分析においてこれらを別々のアームとして維持することができた。治療効果の算出に使った統計手法が記載されているが、細かすぎで、飛ばして良いだろう。治療効果には広義の正規事前分布を、異質性標準偏差には試験特異的な切片と半正規事前分布を用い、ランダム効果モデルを適用した。 4つのチェーンを使用し、各チェーンごとに2000回の反復と1000回のウォームアップ後の抽選を行った。治療間で直接、ランダム化比較試験があった直接比較と、なかった治療間や、どのような治療間の比較が多かったかなどの、ネットワークの接続性は、Figure 4.のようなネットワークプロットを見て、検討したと書いてある。ノードとは、単に、治療薬の名前と言うこと。Nonadは、抗うつ剤以外の全ての介入なので何でもありだ。ノードの大きさが参加者数で線の太さが研究数は、一般的である。また、 unrelated mean effects model (inconsistency modelとも言う)というモデルを使ったとかもあるが、あまり気にしなくて良いだろう。後は、ネットワークの形があまりにもバラバラでないことをチェックしたという感じなことが書いてある。ネットワークプロットによりネットワーク接続性を調べた。ネットワークプロットでは、治療のみのモデルの場合、ノードは各介入を表す。治療用量モデルでは、抗うつ薬のノードは、抗うつ薬と用量（低用量、標準、高用量）を表す。ノードの色は抗うつ薬クラスを表し、「nonad」ラベルは抗うつ薬でないすべての介入を意味する。各ノードのサイズは、その介入を調査したすべての研究からの参加者の合計サンプルサイズを表し、線の太さはその比較のための研究数を表す。フォレストプロットは、ネットワーク内の各介入の推定値と信頼区間を、プラセボを基準（参照比較）として示している。続く

22.

続き各パラメーターの潜在的なスケール減少係数を用いて収束性を評価し、有効サンプルサイズが十分に大きいことを確認し（Vehtari 2021）、発散遷移がないことを検証した（Betancourt 2015）。ネットワークの形状が十分な連結性を可能にする場合、治療、治療-用量、クラス、バイアスリスク、条件の連結ネットワークを適合させて異質性を検討した（Dias 2013）。各パラメーターの潜在的なスケールダウン係数を用いて収束性を評価し、有効なサンプルサイズが十分に大きいことを確認し（Vehtari 2021）、分岐遷移がないことを検証した（Betancourt 2015）。ネットワークの形状が十分な連結性を許す場合、治療、治療-用量、クラス、偏りのリスク、条件について連結ネットワークを適合させて異質性を探った（Dias 2013）。平均残留偏差を使用してモデルの適合性を評価し、ネットワーク形状が許す限り、unrelated mean-eFect models（UME）およびノード分割によって矛盾を探索した（Dias 2013a）。各モデルからの残留デビアンス寄与を比較するdev-devプロットを使用して、矛盾を探索した。線上の点はどちらのモデルでも同じように適合し、線の上または下の点は2つのモデルのどちらかでより適合することを示している（Phillippo 2022年）。ここでノード分割という記載があるが、このノードは、ネットワーク推定値を直接比較の分と間接比較の分に分けたという意味で、直前までのノードとは、少し意味が異なっている。これも、NMAでは普通に行われること。ノード分割プロットでは、直接、間接、複合のエビデンスを同じプロットで表示し、比較を可能にした。 GRADEハンドブックに従って、エビデンスの確実性を評価したとある。また、 cumulative posterior ranks も行ったとあるが、これは、このハンドブックに記載がない、よって、この時点では何を言っているか不明。結果でわかるかも。 GRADE（Schünemann2013）を用いたエビデンスの強さの評価とともに、効果推定値と効果の累積事後順位を報告した。 Schünemann2013：GRADEハンドブック https://gdt.gradepro.org/app/handbook/handbook.html

https://gdt.gradepro.org/app/handbook/handbook.html

23.

治療法で、どれが一番効果があったかを、統計学的に検出する方法の一つが、SUCRAという方法で、そのグラフの面積が大きいほど順位が高くなる（後で解説）。治療法の相対効果および平均順位を報告し、各アウトカムに対する異なる治療法の順位範囲を示すthe surface under the cumulative ranking curve (SUCRA)をプロットした。治療のみとか、治療後のみとか、術前後の差とか、いろいろの報告型式があったので、それらが似通った報告をしているかを、DICという情報基準という統計手法を用いて、確認したとある。 DIC（偏差情報量規準）を用いて、異なる報告モデル（治療のみ、治療量、クラスと、変化スコア、介入後研究の対比モデル）を比較し、そのパースモニーを評価することができた。DICに実質的な差がある（5以上）、またはDICはわずかに低いがTauが低く、残留偏差が3以上の研究が少ないモデルの組み合わせは優れていると判断した。我々は、パーシモン、矛盾の最小化（UMEとノード分割モデルで特定）、残留偏差、異質性（Tauとして測定）に基づき、報告するモデルを選択した。このアプローチは、結果の臨床的探求とオーバーフィッティングのリスクのバランスをとるものである（Dias 2013）。NMA、UME、ノード分割モデルは、R（バージョン4-1.3）のmultinmaで実装した。モデリングフレームワークの更なる詳細は、Phillippo 2018; Phillippo 2022 によって記述されている。

24.

サブグループ解析と異質性の検討サブグループ解析は、異質性がある場合の原因となるかを評価するので、再度、異質性がでてくる。以下のサブグループ解析と行ったとあり、また、データが少なくて、できなかったサブグループが記載されている。データが許す限り、以下の因子についてサブグループ解析を実施した。 - 抗うつ薬のクラス（SSRI、SNRI、TCA、MAOI、その他）。痛みの状態の種類データに予想される異質性とばらつきを考慮するために、ベイズ型ランダムエフェクターNMAを使用した。これらの方法によって、研究間の分散要素に内在する不確実性を、効果推定精度に反映させることができた。これらのサブグループ解析は、別々のモデルを構築して行いましたが、これはネットワークの形状や接続性に依存します。データの希少性から、以下の因子については、いずれのアウトカムにおいてもサブグループ分析を行うことができなかった。 - 研究の目的（例．介入対象が痛みか気分か） ◦気分への対応を主目的とした研究は1件のみ（Richards 2015） - ベースラインのうつ病レベル（各測定基準で定義された、なし、軽度、中度、高度） ◦ 診察の結果、最もよく使われる5つの尺度（BeckDepression Inventory、Brief Pain Inventory Mood Item、SF-36 Mental Component Score、SF-36 Mental Health Subscale、 Hamilton Depression Rating Scale）の平均点は、すべてnone／minimalの範囲であった。

25.

感度分析近年、基本的に、バイアスのリスクが高いものと低いもので別に解析して、同じ結果かなどを、チェックする感度分析を行うのが一般的になってきたので、それを行ったとある。バイアスリスク判定（高い、高くない）で分析できたのは、実質的な疼痛緩和のみであった。また、活性プラセボと不活性プラセボを比較した結果、活性プラセボを使用した研究が9件しかなかったため、感度分析を行うことができなかった。

26.

エビデンスの確実性 NMAの確実性を評価するために、主にCINeMAフレームワーク（Nikolakopoulou 2020）を使用した（次で解説）。ベイズの枠組みで実施された本レビューのNMAとは対照的に、CINeMAはRのnetmeta パッケージ（Rücker 2017）を用いたfrequentist framework内で動作する。CINeMA のフレームワークは、NMA内の特定の問題が、結果からなされる臨床的意思決定に与える影響を考慮するものである。このフレームワークはGRADEをベースとしており、 NMAに特有の以下の6つの領域を考慮する（Nikolakopoulou 2020）。 • Within-study bias（いわゆる、リスクオブバイアス） • Reporting bias（出版バイアス・報告バイアス） • Indirectness（非直接性） • Imprecision（不精確さ） • Heterogeneity（異質性・非一貫性） • Incoherence（NMAでは、これが増えて、非推移性）以上より、high certainty, moderate certainty, low certainty, very low certaintyと評価した。また、CINeMAを使用できないアウトカム（有害事象、重篤な有害事象、離脱）については、GRADEを使用しました。

27.

NMAでのエビデンスの確実性について NMAでの（効果推定値の）エビデンスの確実性の評価は、2通りが多く使われている。 • GRADEアプローチによる、直接比較を重要視した方法 • GRADEアプローチから派生して、ネットワーク全体を重視した、CINeMAという方法コクランでも、この2つのどちらが良いとかの結論はでていない。どちらも、「高・中程度・低・非常に低」と分類。抄録にわざわざ記載されているROB-MENは、 CINeMAで使うツールの一つであり、気にしなくて良い。また、治療の順位も、以下の違いがある。 • GRADEアプローチでは、エビデンスの確実性と効果推定値の大きさを順に並べて色分けして、見やすい表として検討する • CINeMAでは、the surface under the cumulative ranking curve (SUCRA)というランキング（面積が大きい順）を統計手法で算出するここで、注意が必要なのは、SUCRAというランキングの確実性については、上の（効果推定値の）エビデンスの確実性とは別に評価しなければならない。ランキングに確実性がなければ、ランキングは使えない。どうも、この論文では、ランキングの確実性の評価は、少ししかされてないようだ。と言うことは、ランキングは信用できないかもしれない。また、「CINeMAを使用できないアウトカムについては、GRADEを使用しました」とあるが、これは、上の GRADEアプローチのNMAのエビデンスの確実性の評価をおこなったのでなく、普通の2群比較のメタ分析の GRADEアプローチでエビデンスの確実性を評価したといいうだけの事である。

28.

まとめ方分析の規模が大きいため、抗うつ薬を投与した参加者の合計が200人以上である抗うつ薬のみを記述と所見表の要約（ summary of findings tables・SoF表）に含めました。この決定は、最終的な結果と結論の品質と確実性を確保するために行った。この決定は、疼痛研究のエビデンスの階層（Tier 2では少なくとも200人の参加者のデータを使用する）を参照することで行った。

29.

結果

30.

Results of the search 最終的に、169論文を組み込んだ。

31.

含まれた論文 • • • • • • • • • • • 59 studies included fibromyalgia 49 studies included neuropathic pain 40 studies included musculoskeletal pain Nine studies included primary pain syndromes (not including fibromyalgia) that is, described only as 'somatoform' or 'idiopathic' pain Six studies included gastrointestinal pain Four studies included non-cardiac chest pain Two studies included burning mouth syndrome Two studies included visceral pain One study included atypical facial pain One study included phantom limb pain One study included pelvic pain • Amitriptyline: 1843 (43 studies) • Bupropion: 54 (1 study) • Citalopram: 97 (5 studies) • Clomipramine: 124 (2 studies) • Desipramine: 336 (7 studies) • Desvenlafaxine: 884 (2 studies) • • • • • Dothiepin: 55 (3 studies) • Doxepin: 30 (2 studies) • Duloxetine: 6362 (43 studies) • Escitalopram: 93 (3 studies) • Esreboxetine: 978 (2 studies) • • • • Fluoxetine: 277 (11 studies) • Imipramine: 300 (7 studies) • Maprotiline: 135 (4 studies) • Mianserin: 107 (2 studies) • • • Milnacipran: 3110 (18 studies) • Mirtazapine: 255 (2 studies) • Moclobemide: 42 (1 study) • • • Nortriptyline: 374 (7 studies) • Paroxetine: 422 (9 studies) • Pirlindole: 50 (1 study) • Reboxetine: 18 (1 study) • Sertraline: 91 (3 studies) • Trazodone: 63 (3 studies) • Trimipramine: 18 (1 study) • Venlafaxine: 489 (8 studies) • Zimeldine: 10 (1 study • Antidepressant versus placebo (83 studies, e.g. Hudson 2021) Antidepressant versus active comparator (22 studies, e.g. Enomoto 2018) Antidepressant versus the same antidepressant at diFerent doses versus placebo (17 studies, e.g. Arnold 2012b) Antidepressant versus active comparator versus combined antidepressant + active comparator (13 studies, e.g. Ang 2013) Antidepressant versus active comparator versus placebo (9 studies, e.g. Rowbotham 2012) Antidepressant versus diFerent antidepressant (9 studies, e.g. Kaur 2011) Antidepressant versus active comparator versus combined antidepressant + active comparator versus placebo (8 studies, e.g. Gilron 2016) Antidepressant versus diFerent antidepressant versus placebo (7 studies, e.g. Heymann 2001) Antidepressant versus diFerent antidepressant versus active comparator (4 studies, e.g. Boyle 2012) Antidepressant versus the same antidepressant at diFerent doses (2 studies, e.g. Chappell 2009a) Antidepressant versus same antidepressants at diFerent doses versus diFerent antidepressant versus diFerent antidepressant at diFerent doses versus placebo (1 study, Atkinson 2007) Antidepressant versus diFerent antidepressant versus combined antidepressants versus placebo (1 study, Goldenberg 1996)

32.

除外論文 We excluded a total of 655 references with reasons throughout the course of this review. The main reasons for exclusion were as follows. • Duplicate records (including trial registrations): 144 records • Not chronic pain condition: 71 records • Not accessible (primarily conference abstracts): 92 records • Pooled analysis: 50 records • Open-label: 42 records • Fewer than 10 participants per arm: 22 records • Single-blind: 15 records • Washout period not more than five lengths of antidepressant half-life: 1

33.

Risk of bias

34.

Risk of bias 以下について、解説があるが、169論文のまとめなので、さすがに、まとめ、だけとなるだろう。 Allocation・Blinding・Incomplete outcome data・Selective reporting・Other potential sources of bias

35.

Substantial pain relief (50% reduction）50％減少のカットオフで分けた2値変数実質的な疼痛緩和のための治療用量ネットワークは、異質性が最も少なく、矛盾の証拠がなかったモデルであったため、報告した。我々は、42のRCTを対象とし、合計14,626人の参加者を得た（研究の範囲は47から 1108まで）。 25の異なる介入があり、いくつかの比較は、1つの研究からの直接的な証拠によってのみ知らされた。表2（ｐ429）は、解析に含まれる各抗うつ薬の用量に関するRCTの数と参加者の総数を示している。ネットワークが切断されたため、2つの研究のデータを含めることができなかった。残差devianceと収束診断に基づくモデルの適合性に関して懸念はなかった（ There were no concerns regarding model fit based on residual deviance and convergence diagnostics. よくわからないが、どもかくモデルの適合は良かったということ）。ネットワーク図は図4に、フォレストプロットは図5に示す。表2：抜粋 Treatment RCTs Participants Desvenlafaxine high dose Duloxetine low dose Duloxetine standard dose Duloxetine high dose Esreboxetine standard dose Esreboxetine high dose Milnacipran standard dose 2 6 15 14 1 1 2 655 593 2429 1837 553 280 644

36.

実質的な鎮痛効果で上位にランクされた抗うつ薬を表 3 に示す。p430 Table 3. Top-ranked antidepressants for substantial pain relie Antidepressant Credible intervals 2.5% 97.5% Odds ratio Mean rank Duloxetine standard dose 1.91 (1.69 to 2.17) 8.3 5 12 Duloxetine high dose 1.91 (1.66 to 2.21) 8.5 5 12 Milnacipran high dose 1.64 (1.04 to 2.58) 10.9 4 19 Esreboxetine standard dose 1.72 (1.13 to 2.62) 11 4 19 Milnacipran standard dose 1.65 (1.28 to 2.13) 11.8 6 18 Mirtazapine standard dose 1.30 (0.79 to 2.15) 15.4 6 21 Duloxetine low dose 1.71 (1.36 to 2.20) 15.7 11 20 Esreboxetine high dose 1.29 (0.79 to 2.11) 15.7 7 22 Desvenlafaxine high dose 1.19 (0.83 to 1.70) 16.8 11 21 CI: confidence interval Credible intervals:信用区間

37.

SUCRA (Surface Under the Cumulative Ranking Curves) 日本語だが、難解な解説がある。 https://info.zanet.biz/?p=885 累積順位曲線下面積は、それぞれの治療について累積順位確率を縦軸に順位を横軸にして描かれる曲線下の面積になる。しかし、ややこしいのが、 mean SUCRAと書かれていると、面積だから数字が大きい順だが、mean rankと書かれているとランキング順で、数字の小さい順。これには、それと信用区間の4分位数（2.5% and 97.5%）が記載されているが、この記載が必須ではなさそう。それよりも重要なのは、各ペアに対するエビデンスの確実性と、ランキング自体のエビデンスの確実性は異なり（下図を参照）、今回のランキングには、ランキング自体のエビデンスの確実性が評価されてない。ただし、unrelated mean-effect models and node-splittingがinconsistency（たぶん、Incoherence（非整合性）の事）を示した場合は、信頼できる治療順位でないので、ランキングしてないことより、ランキングがあるものは、ある程度の確実性があるという見解である。

https://info.zanet.biz/?p=885

38.

まず、この解析は、基本的にプラセボとの比較での効果推定値やランキングである。そしてランキングはあまり信用できないが、確かにORの95％CIの下限もかなり大きいので、臨床的に意味がありそうな感じである。デュロキセチン標準用量およびデュロキセチン高用量は、実質的な疼痛緩和をもたらす抗うつ薬の上位に位置し、プラセボと比較して同等の有効性を示した（それぞれOR 1.91, 95％ CI 1.69～2.17, OR 1.91, 95％ CI 1.66～ 2.21, ）。ミルナシプラン高用量（OR 1.64, 95％CI 1.04～2.58）とエスレボセチン標準用量（OR 1.72, 95％CI 1.13～ 2.62）も同等であったが、デュロキセチン標準用量、デュロキセチン高用量に比べ効果は低かった。有意差について述べるのは、本来は良くなくて、OR＝1を効果があるないと判断するならば（最小臨床差より小さい値になるが）、95％CIがまたぐということ。ミルタザピン標準用量、エスレボキセチン高用量、デスベンラファキシン高用量は、プラセボと比較して有意差は認められなかった。視覚的に表現したものが、何か不明です。Table3のことかもしれないが、普通の表だが。解析に含まれる各治療法の累積順位を視覚的に表現したもので、相対効果や平均順位信頼区間の解釈を大きく変えるものではありませんでした。 unrelated mean-effect modelは、inconsistency modelとも言うから、このような文章になる。 unrelated mean-effect modelは、用量-治療モデルと同様のdeviance情報基準を持ち、inconsistencyを示す証拠はなかった。直接比較と間接比較で、矛盾があるかをみるのは、NMA推定値を直接と間接にわかるというノード分割というのを行って、検討しますので、それらについて書かれていると思われる。これらの図は、補足ファイルとで、Table3の p430以降を見ると、Tableしかなく、Figureがないぞ？直接証拠と間接証拠を比較することが可能な9つの比較すべてについて、ノードスプリッティングモデルで確認した。プレガバリンとプラセボの比較では、ベイズP値が最も小さく（P = 0.3）、単一研究に基づくプレガバリンの効果の過小評価を示唆する直接証拠がある場合、inconsistencyがあることを示す。これらの図は、補足ファイルに掲載されています。一貫したエビデンスネットワークがあるため、感度違反の調査は必要なかった。

39.

Imprecision・Incoherence 注意：直接比較と間接比較で、矛盾があるかをみるのは、 incoherence（非整合性）とよばれるが、inconsistency（一般的には非一貫性で、heterogeneityのこと）と表現する先生もいる。たぶん、本文の他の部分より、この論文では、 incoherenceのことを、 inconsistencyとしていると推察された。詳細には、p20に incoherence定義があったが、 inconsistency の定義はなかった。 Incoherence（直接証拠と間接証拠の結果の一致） ◦ ネットワーク内の直接証拠と間接証拠のばらつきであり、 Transitivityの評価でもある。CINeMAは、直接推定と間接推定の推定値の95％CIを比較します。これらの推定値がともに臨床的同等性の範囲の同じ側にある場合、 incoherenceに関する懸念はありません。

40.

Figure 4. Substantial pain relief network plot. NASSA: noradrenergic and specific serotonergic antidepressants（ノルアドレナリン作動性・特異的セロトニン作動性抗うつ薬） SNRI: serotonin noradrenalin reuptake inhibitors（セロトニン・ノルアドレナリン再取り込み阻害剤; 総称名:デュロキセチン; 一般名:デュロキセチン塩酸塩;） SSRI: selective serotonin reuptake inhibitors（選択式セロトニン再取り込み阻害薬） TCA: tricyclic antidepressants三環系抗うつ薬（総称名:トリプタノール; 一般名:アミトリプチリン塩酸塩） nonad: non-antidepressants

41.

Figure 5. Substantial pain relief forest plot (log odds ratio with credible intervals) 方法にプラセボが参照比較とある・ Log ORに注意。 Fig4と治療薬のグループの色が違うようだが？ここには、エビデンスの確実性が書かれてないので、このフォレストプロットだけで判断してはいけない。

42.

TCA三環系抗うつ薬のネットワークを見てみようたとえば、TCAは、症例数も研究数も少なく（○が小さく線が細い）、かつ、プラセボとの直接比較もない（点線のところ）ものがあることがわかる。また、症例数の多い、duloxetineとの直接比較がほとんどない。よって、エビデンスの確実性は低そうな雰囲気がある。

43.

TCAの効果推定値は、下の2つは、他より比較的大きい。しかし、duloxetine highなどのプロットと比較すると、95％信用区間が広いことがわかる。たぶん、不精確だろう。

44.

Heterogeneity・Class・ Condition（これは順番を後で）補足ファイルのどこか不明だった。オーバーフィットover-fittingのリスクはあるが、患者、臨床医、そして生活の質全体にとってのアウトカムとしての実質的な痛みの重要性から、複数のモデルの結果を要約することにした。すべてのモデルの完全な結果は、補足ファイルに報告されている。個別の薬剤・容量の違いをまとめて、4つに分類して、NMAを行った。この4つで差があるかを見たかったが、inconsistency（非整合性）と信頼区間が重なっていたので、この4つに差があるとは言えなかったということ。治療法をクラスに集約してネットワークを作成した。分析対象は4つの抗うつ薬クラスである： SNRI、TCA、TeCA、NaSSAの4つの抗うつ薬クラスが含まれるが、inconsistencyや信頼区間の重複のため、クラスの違いについて信頼できる結論を出すことはできなかった。

45.

バイアスのリスク・CINeMA バイアスのリスクが高い研究を削除した場合の影響を調べるため、感度分析を行った。その結果、 15件の研究がバイアスのリスクが低いと評価された。結果として得られたネットワークのモデルは不安定で、モデルの収束に問題があることを示す発散遷移が見られた。unrelated mean-effect modelやdev-dev plot（ 2種類のモデルの偏差を比較してプロットする方法で、モデル間で不整合性があるかをみる）では不整合性は確認されなかったが、ネットワーク形状のためノード分割では確認することができなかった。結果は、治療用量モデルと一致していた。抗うつ薬の順位は、エスレボセチン（平均順位＝3.73、97.5％信頼区間＝2～7）、デュロキセチン（平均順位＝4.64、97.5％信頼区間＝3～6）の2つが最高順位であった。 heterogeneityを探るために複数のモデルを当てはめ、 inconsistencyを探るためにunrelated mean-effect modelとノード分割モデルを利用したことに加え、CINeMAによるエビデンス強度の評価を容易にするために、一対の直接エビデンスとネットワークエビデンス（用量に関するマルチアーム試験を除く）をさらに分析した。 design-by-treatmentテスト（設計ごとの治療相互作用モデルの変量効果を使用て関心のあるパラメーターを推定するということだが、これでもわからない、ともかく、incoherence（非整合性）を評価する方法、本論文では、 inconsistency と表現）では、直接エビデンスと間接エビデンスの間に矛盾はなかったが（Chi 2 = 14.069, P = 0.296）、duloxetine low doseとdesvenlafaxine high doseは、heterogeneity（異質性）を示す高いI2統計値（73.6％、65.8％）を有していた。デュロキセチン低用量、標準用量、高用量については、中程度の確実性があると評価した。その他の抗うつ薬の用量は、バイアスリスクの高い研究、不正確さ（推定値がゼロになる）、そして少量であるという大きな懸念から、確実性が低い、または非常に低いと評価した。

46.

Summary of findings さて、ここまで見ると、Summary of findings が読めるようになる。効果推定値の95％CIの下限も、プラセボに対して1000人中100人の増加で、エビデンスの確実性は中等度、さらにランキングはあくまでも参考だが、ランキングが高かったのが、デュロキセチン標準用量およびデュロキセチン高用量であったと読めるだろう。著者らは、「equally efficacious in comparison to placebo」と評価しているが、効果があると思われる。残念ながら、よく使われる？ TCA: tricyclic antidepressants三環系抗うつ薬（総称名:トリプタノール; 一般名:アミトリプチリン塩酸塩）は、途中から、参加者の合計が200人以上いないため、はぶかれて、SoF表にも記載がないことを念頭に、SoF表を見てみよう。･･･よって、エビデンスの確実性すら不明である。書いておいてよ～。

47.

[beta]

Summary of findings 1. Substantial pain relief summary of findings
Estimates of effects, credible intervals, and certainty of the evidence for substantial pain relief in people with chronic pa in
Bayesian network meta-analysis summary of findings table
Patient or population: people with chronic pain
Interventions: desvenlafaxine high dose (≥ 50 mg); duloxetine low dose (< 60 mg), standard dose (60 mg), and high dose (> 60 mg);
esreboxetine standard dose (4-8 mg) and high dose (≥ 8 mg); milnacipran standard dose (100 mg) and high dose (> 100 mg);
mirtazapine standard dose (30 mg)

Comparator (reference): placebo
Outcome: substantial pain relief (≥ 50% reduction in pain intensity from baseline) as measured on various scales including 0 -10 VAS, 0100 VAS, and the Brief Pain Inventory
Direction: higher is better (i.e. more people reporting substantial pain relief)

Network meta-analysis-summary of findings table definitions
*Anticipated absolute effect. Anticipated absolute effect compares 2 risks by calculating the difference between the risk of the intervention
group with the risk of the control group.（予想される絶対効果とは、介入群のリスクと対照群のリスクの差を計算することで、2つのリスクを比較す
るものである）（計算式は、Absolute Risk Difference: ((ORpredictor * Baseline risk)/ ((1-Baseline risk) + (ORpredictor * Baseline risk))) - Baseline
risk）
** Mean rank and credible intervals are presented.
CI: confidence interval; CINeMA: Confidence in Network Meta-Analysis; NNTB: number needed to treat for an additional beneficial outcome（有
益なアウトカムを追加で治療するために必要な数、なので、NNTと同じで良い、harmfulなら、NNTHとなる）; OR: odds ratio; RCT: randmised
controlled trial; VAS: visual analogue scale（ベイズの解析では、95％信頼区間でなく、信用区間（credible interval ）なので、なぜconfidence interval
となっているのか不明？）

The number of participants for each antidepressant reflects the total number of participants taking the antidepressant or placebo from the
studies in the network meta-analysis.（各抗うつ薬の参加者数は、ネットワーク・メタアナリシスの研究から抗うつ薬またはプラセボを服用した参加
者の総数を反映したものである。）
CINeMA grades of confidence in the evidence
High: further research is unlikely to change our confidence in the estimate of effect.
Moderate: further research is likely to have an important impact on our confidence in the estimate of effect and may change the estimate.
Low: further research is very likely to have an important impact on our confidence in the estimate of effect and is likely to change the estimate.
Very low: we are very uncertain about the estimate.

48.

To t al studies: 42 R e lative effect To t al participants: 14,626 (O R and 95%CI) With placebo With in tervention Difference 1.91 592/2061 1058/2429 1 48 more per 1000 (1.69 to 2.17) 287 per 1000 435 per 1000 1 18 to 176 Du loxetine standard dose RCTs: 16 Participants: 4490 Du loxetine high dose RCTs: 14 Participants: 3692 Milnacipran high dose RCTs: 1 An ticipated absolute effect (event rate)* 1.91 431/1855 674/1837 1 34 more per 1000 (1.66 to 2.21) 232 per 1000 366 per 1000 1 02 to 168 1.64 38/145 88/239 1 06 more per 1000 (1.04 to 2.58) 262 per 1000 Certainty of the R anking**(2.5% to e vidence 9 7 .5% credible (CI NeMA) in terval) Moderate,a 8 I n terpretation of findings Equivalent to NNTB of 7.1 (5 to 12) 8 Moderate,a (5 to 12) 11 Very lowa,b 368 per 1000 (4 to 19) Equivalent to NNTB of 7.4 Equivalent to NNTB of 9.4 Participants: 384 Esreboxetine standard dose RCTs: 1 Participants: 828 Milnacipran standard dose RCTs: 2 Participants: 1298 Mir tazapine standard dose RCTs: 1 Participants: 422 Du loxetine low dose RCTs: 6 Participants: 1116 Esreboxetine high dose RCTs: 1 Participants: 555 De svenlafaxine high dose RCTs: 2 Participants: 870 1.72 33/275 105/553 7 0 more per 1000 (1.13 to 2.62) 120 per 1000 190 per 1000 1 3 to 143 1.65 130/654 187/644 9 1 more per 1000 (1.28 to 2.13) 199 per 1000 290 per 1000 4 2 to 147 1.3 33/211 41/211 3 9 more per 1000 (0.79 to 2.15) 156 per 1000 194 per 1000 - 29 to 128 1.71 150/523 242/593 1 20 more per 1000 (1.36 to 2.20) 287 per 1000 407 per 1000 6 7 to 183 3 0 more per 1000 1.29 33/275 42/280 (0.79 to 2.11) 120 per 1000 150 per 1000 1.19 51/215 177/655 (0.83 to 1.70) 237 per 1000 270 per 1000 Low,a 11 Equivalent to NNTB of 14 (4 to 19) Low,a,c 12 Equivalent to NNTB of 11 (6 to 18) Low,e 15 (6 to 21) Moderate,,a,b,c 16 Equivalent to NNTB of 8.3 (11 to 20) Very low,a,b 16 (7 to 22) 3 3 more per 1000 Not significantly different from placebo Very low,a,b 17 (11 to 21) Not significantly different from placebo Not significantly different from placebo aDowngraded due to within-study bias. bDowngraded due to imprecision in the estimate. cDowngraded due to heterogeneity in the estimate. dDowngraded due to incoherence in the network. eDowngraded due to a small number of trials and participants; we cannot draw reliable conclusions. 赤の絶対差の95％信頼区間は、論文に記載がなかったので計算した。 Rankingは、Table3と同じだ。

49.

ランキングでなく、エビデンスの確実性と絶対効果の大きさで表示した（CINeMAでなくGRADEアプローチの本法に近い方法）エビデンスの確実性効果の大きさ（95％CIの下限）効果の大きさ（点推定値） 118 148 効果の大きさ（1000人中100人を、臨床的に効果があるとの閾値とした（個人的な判断））薬剤名 Duloxetine standard dose 大きい中等度 102 134 67 120 42 91 Duloxetine high dose 小さい Milnacipran standard dose 低非常に低 Duloxetine low dose 僅か 13 70 -29 39 Esreboxetine standard dose 95％CIが害～100人の閾値までのため、不精確さが非常に深刻であり、エビデンスの確実性は非常に低と判断 Mirtazapine standard dose 抗うつ薬を投与した参加者の合計が200人以上である抗うつ薬のみプラセボが参照比較このアウトカムの評価でも、やはり、Duloxetine標準用量およびDuloxetine高用量は、効果がある（エビデンスの確実性：中等度）となりそう。また、Duloxetine low dose（Duloxetineと直接比較あり）・Milnacipran standard dose（直接比較なし）・Esreboxetine standard dose （直接比較なし）とのペア比較でも効果があると、さらに判断が容易になる。他の患者にとって重大なアウトカムでも同様の評価なら（これは、各自で考えてね・特に害がなければ）、推奨できそうだ。

50.

Condition・病態研究では、神経障害性疼痛neuropathic 、線維筋痛症fibromyalgia 、筋骨格系疼痛 musculoskeletal 、原発性疼痛primary 、および消化器系疼痛症状gastrointestinal pain conditionsを含む、実質的な疼痛（ substantial pain）が報告されました。ただし、神経障害性疼痛および線維筋痛症の疼痛症状のみが関連ネットワークを持っていました。神経障害性疼痛は、ランキングがないとだけで、サブグループの結果は、まったく示されてなかった。神経障害性疼痛に関しては、unrelated mean-effect models and node-splittingが inconsistency（たぶん、Incoherence（非整合性）の事）を示したため、信頼できる治療順位を導出することができませんでした。線維筋痛症に対しても、ランキングの平均ランクの値が本文にあるのみで、効果推定値も記載がなかった。線維筋痛症については、ネットワークの形状が一貫性の分析を妨げましたが、エスレボキセチン、ミルナシプラン、およびドゥロキセチンは比較的同等にランク付けされました。エスレボキセチン（平均順位= 2.02、97.5％信用区間= 1から4）；ミルナシプラン（平均= 2.30、97.5％信用区間= 1から4）；ドゥロキセチン（2.48、97.5％信用区間= 1から4）。

51.

小括本解析は、あくまでも、神経障害性疼痛neuropathic 、線維筋痛症 fibromyalgia 、筋骨格系疼痛musculoskeletal 、原発性疼痛 primary 、および消化器系疼痛症状gastrointestinal pain conditions を含む慢性疼痛の人people with chronic painである。当初の懸念の、違う病態を一緒に検討している。この分野では、これで許されるのか、専門家の意見を聞きたいところではあるが、残念感は拭えない。また、デュロキセチン標準用量およびデュロキセチン高用量のエビデンスの確実性は中等度であったが、アミトリプチリンは、ランキング外として、評価できるエビデンスがなかったとしているので、エビデンスの確実性や効果推定値不明（フォレストプロットに僅かあるが）となった。

52.

それ以降それ以降は、基本的に、同じように、NMAの記載がある。また、p88－p401は、Characteristics of included studiesであり、もし、採用論文の内容を知りたいときに見るが、そもそも、どの論文が、どの解析に使われたのかが、直接比較の普通のメタ分析のフォレストプロットなどが、まったく無い事より、この表に戻るのは、なかなか困難である。また、総当たりのリーグテーブルがないため、あくまでもプラセボとの比較の効果推定値しか不明であり、薬剤間の比較を知りたくても、わからない（ネットワーク図より、確実性が低そうなので、役にたたないかもしれないが、少しは知りたかった気もする）。

ネットワークメタ分析の論文の図表の理解しよう：慢性疼痛患者と抗うつ剤P34まで

MXE05064

関連スライド

MCID（最小臨床重要差）20200906

ネットワークメタ分析の論文の図表の理解しよう第1弾：サルコペニアと運動のNMA

「人年」という単位を勉強しよう

ネットワークメタ分析の論文の図表の理解しよう第2弾：2型糖尿病の薬物療法

診療ガイドラインの説明2024年8月（エビデンスレベルとエビデンスプロファイルを作るとMindsの間違いあり）

Component network meta-analysis 公開版

各ページのテキスト

ネットワークメタ分析の論文の図表の理解しよう：慢性疼痛患者と抗うつ剤P34まで

MXE05064

関連スライド

MCID（最小臨床重要差）20200906

ネットワークメタ分析の論文の図表の理解しよう第1弾：サルコペニアと運動のNMA

「人年」という単位を勉強しよう

ネットワークメタ分析の論文の図表の理解しよう第2弾 ：2型糖尿病の薬物療法

診療ガイドラインの説明2024年8月（エビデンスレベルとエビデンスプロファイルを作るとMindsの間違いあり）

Component network meta-analysis 公開版

各ページのテキスト

ネットワークメタ分析の論文の図表の理解しよう第2弾：2型糖尿病の薬物療法