13.4K Views
March 29, 24
スライド概要
[第8回大阪sas勉強会] 飯田絢子
SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです
MMRM入門 2023年3月24日 臨床開発事業本部 データサイエンスセンター 統計解析2部 飯田 絢子
発表内容 1 MMRMとは~3つのポイント~ 2 MMRMをsasで実行する ◆ オプションの説明 ◆ 出力結果の見方 ◆ 帰無仮説とP値 3 MMRMの仮定条件と残差の分布 4 まとめ Copyright © 2018 EPS All rights reserved. 2
MMRMとは~3つのポイント~ ◆ mixed effect models for repeated measures 直訳:反復測定データに対する混合効果モデル 「混合」,「mixed」が入っている ものはすべて混合効果モデル. そのうち線形のものが線形混合効果モデル ◆ 「線形混合効果モデルの一種で、不完全な経時測定データを解析するために利 用される統計モデルである」 引用:応用統計学 46 巻 (2017) 2 号 p. 53-65 「経時測定データ解析における mixed-effects models for repeated measures(MMRM)の利用」 ◆MMRM前提条件:欠測メカニズムがMAR(missing at random) ①線形混合効果モデルの一種である ②欠測のある経時的反復データの解析モデルである(欠測がなくてもOK) ③ただし、全ての欠測に対して万能ではない 3
MMRMとは~①線形混合効果モデルの一種である~ 線形混合効果モデル:「混合」,「mixed」…とにかく何かが混ざっている 何が混ざっているか:固定効果とランダム効果が混ざっている 線形:yとXが直線関係で表せる 一般線形モデル:y= Xβ+ε(回帰分析,分散分析,t検定等) 例)体重減少=患者+薬剤の効果+測定時間の影響+ 固定効果 誤差 誤差 線形混合効果モデル:y= Xβ+Zγ+ε 固定効果 ランダム 効果 誤差 固定効果:確定的 例)薬剤群 今あるデータしか取 らないつもり ランダム効果:母集団からの抽出 例)患者 (変量効果) 今あるデータはたまたま。 他の値も取ると想定 患者:測定した患者からの体重減少のみではなく、測 定していない他の患者にも適応したい。ランダム効果。 薬剤:薬剤Aをxmgを用いたとする。この用量水準は, たまたまではなく,意図して定めたもの。他の水準が たまたま選ばれることはないので,固定効果 測定時間:定めた測定時間以外も検討したい(通常あ まりないが)場合はランダム効果。通常は固定効果 固定効果もランダム効果も試験目的や意思次第で決定。 ランダム効果か誤差かも匙加減。 何を固定,ランダムとするかは意思決定による→事前に仕様等に明記が必要! 4
MMRMとは~②欠測のある経時的反復データの解析モデルである~ (欠測がなくてもOK) ◆ 「線形混合効果モデルの一種で、不完全な経時測定データを解析するために利用される統計モデルである」 引用:応用統計学 46 巻 (2017) 2 号 p. 53-65 「経時測定データ解析における mixed-effects models for repeated measures(MMRM)の利用」 ◆ 不完全データ(欠測がある)ことによる問題 ①バイアスの問題 症状悪化による欠測があった場合 欠測に対する考慮不足で承認 不可になることも 不完全な 経時的反復測定データ repeated measures 欠測を除くと症状悪化していない症例のみで評価してしまう →良い結果へと偏りが出る可能性 ②精度(検出力)低下の問題 SE = σ √n 体重の経時データ 15.2 欠測を除く分サンプルサイズが小さくなる→標準誤差が大きくなる =本来有意差が出たはずの群間差を検出できない可能性 ◆ 11.2 10.2 体重(g) =推定の精度が下がる→検出力低下(βエラーの上昇) 10.8 10.3 9.8 9.7 8.5 7.9 8.5 7.9 6.4 不完全データを解析するための手法 →欠測値は補完せず,測定データのみで解析:OC →最終データで欠測値を単一補完して解析:LOCF →測定データから欠測値を含めた全体を予測して解析:MMRM Day0 Day1 Day2 Day3 ID1 10.2 9.8 7.9 6.4 ID2 15.2 10.8 9.7 ID3 11.2 10.3 8.5 ? 6.5 ? 5.3 ? 6.2 5.1 Day4 Day5 8.5 5.3 5.1 7.9 6.5 6.2 他にもいろいろ… 相関 ◆ 経時的反復データ=同じ患者で複数回→同じ被検者の1回目と2回目…と結果Y1とY2…には相関がある!相関の強さも変わる→MMRMで柔軟に 5
MMRMとは~③ただし、全ての欠測に対して万能ではない 欠測の種類 MCAR 解析手法 (一部紹介) … MCAR: Missing Completely At Random 完全にランダムな欠測 GEE MI MAR:Missing At Random ランダムな欠測 欠測 MAR MMRM wGEE MNAR SM … MNAR: Missing Not At Randomランダムでない欠測 例)飲むと不調等の有害事象の為患者が自己判断で中断し,連絡不能で脱落 (潜在的に有害事象が絡んでいるが,有害事象を示す測定値がなく, 観測データから欠測が説明できない。) 6
MMRMをsasで実行する proc mixed data=SAMPLE; class TRT TIME SUBJECT; model VAR=TRT TIMETRT*TIME ; random SUBJECT /type=VC subject=SUBJECT ; run; proc mixed data=解析対象データ; (線形回帰式で示すと…) 混合効果モデル(行列式):Y= Xβ+Zγ+ε 従属変数:VAR 固定効果(計画行列):TRT TIME TRT*TIME ランダム効果(計画行列):SUBJECT β:固定効果の未知パラメータ γ:ランダム効果の未知パラメータ γ~N(0,G) ε:誤差 ε~N(0,R) E[Y]=Xβ, V[Y]=ZGZt + R class 分類変数; model 従属変数=固定効果にしたい変数; random ランダム効果にしたい変数 /type=ランダム効果γの分散共分散構造 subject=ブロックを区切る為の変数; run; TRT TIME TRT*TIME SUBJECT yi=切片+β1 X1+β2X2+β3X3 +εi 行列式Y=X β+ Zγ +ε 固定効果計画行列の列数についての詳細は後述。 各変数の水準の数や変数の数等がポイント 7
MMRMによる解析例(sas helpより) ~解析データセット作成~ data pr; input Person Gender $ y1 y2 y3 y4; y=y1; Age=8; output; y=y2; Age=10; output; y=y3; Age=12; output; y=y4; Age=14; output; drop y1-y4; datalines; 1 F 21.0 20.0 21.5 23.0 2 F 21.0 21.5 24.0 25.5 3 F 20.5 24.0 24.5 26.0 4 F 23.5 24.5 25.0 26.5 5 F 21.5 23.0 22.5 23.5 6 F 20.0 21.0 21.0 22.5 7 F 21.5 22.5 23.0 25.0 8 F 23.0 23.0 23.5 24.0 9 F 20.0 21.0 22.0 21.5 10 F 16.5 19.0 19.0 19.5 11 F 24.5 25.0 28.0 28.0 12 M 26.0 25.0 29.0 31.0 13 M 21.5 22.5 23.0 26.5 14 M 23.0 22.5 24.0 27.5 15 M 25.5 27.5 26.5 27.0 16 M 20.0 23.5 22.5 26.0 17 M 24.5 25.5 27.0 28.5 18 M 22.0 22.0 24.5 26.5 19 M 24.0 21.5 24.5 25.5 20 M 23.0 20.5 31.0 26.0 21 M 27.5 28.0 31.0 31.5 22 M 23.0 23.0 23.5 25.0 23 M 21.5 23.5 24.0 28.0 24 M 17.0 24.5 26.0 29.5 25 M 22.5 25.5 25.5 26.0 26 M 23.0 24.5 26.0 30.0 27 M 22.0 21.5 23.5 25.0 ; SAS help Example 78.2 Repeated Measuresより: https://documentation.sas.com/doc/en/statcdc/14.2/statug/stat ug_mixed_examples02.htm 8
MMRMによる解析例(sas helpより) ~解析データセットの説明~ データセットPr 合計27人の8,10,12,14歳時点の 成長記録データ … 27人内訳: ・男性M:16人 ・女性F :11人 各人4時点(8,10,12,14歳) 全レコード:108(27×4=108) Person:症例番号(1~27) Gender:性別(F,M) Age:時点(8,10,12,14歳) y:測定値 9
MMRMによる解析例(sas helpより) ~mixed構文の説明~ … proc mixed data=pr method=ml covtest; class Person Gender; model y = Gender Age Gender*Age / s; random Person /type=VC G GCORR V VCORR subject=Person; run; proc mixed data=解析対象データ; class 分類変数; model 従属変数=固定効果にしたい変数; random ランダム効果にしたい変数 /type=ランダム効果γの分散共分散構造 subject=ブロックを区切る為の変数; run; 【オプション】 method:推定方法。今回はml(最尤法)を指定※デフォルトはREML(制限付き尤度) covtest:漸近検定にて共分散パラメータを計算する s(solution):固定効果の推定解を出力する(点推定値、標準誤差、検定統計量) G:Gの共分散行列を表示 γ~N(0,G)。GCORR:推定Gの相関行列 V:V[Y]の初めの1ブロックを表示. VCORR:推定Vの相関行列 10
MMRMによる解析例(sas helpより) ~Xの計画行列~ X行列(固定効果計画行列)の列数:6 (1+2+1+2=6) class Person Gender; →Ageはカテゴリ変数にしていない Gender Age カテゴリ変数 2水準 Gender*Age 連続変数 切片 男性 , 女性 年齢(連続) 1列 + 2列 +1列 カテゴリ変数×連続変数 データセットPr Person:症例番号(1~27) Gender:性別(F,M) Age:時点(8,10,12,14歳) y:測定値 Gender Age Gender*Age yi=切片+β1 X1+β2X2+β3X3 +εi 行列式y=X β+ +ε 男性×年齢 , 女性×年齢 +2列×1列 =6列 11
MMRMによる解析例(sas helpより) ~固定効果の解~ 固定効果の解の読み取り方 34 29 24 Gender M(男性):Estimate=0→Interceptの値=16.3406 F(女性):Interceptの値+Estimateの値 = 16.3406 +1.0321=17.3727 Age*Gender Age*M(男性):Estimate=0→Ageの値=0.7844 Age*F(女性):Ageの値+Estimateの値 =0.7844+(-0.3048)=0.4796 19 14 0歳 8歳 10歳 12歳 Y_male Y_female Linear (Y_male) Linear (Y_female) 14歳 12
MMRMによる解析例(sas helpより) ~P値の意味~ H0:Interceptがyに影響しない→棄却。切片は影響する H0:切片_女性=切片_男性 棄却せず→切片_女性=切片_男性 は異なるとは言えない H0:Ageがyに影響しない→棄却。Ageは影響する H0:傾きβ_女性=傾きβ_男性 →棄却。傾きβ_女性と傾きβ_男性 は有意に異なる 34 29 24 19 14 0歳 8歳 10歳 12歳 Y_male Y_female Linear (Y_male) Linear (Y_female) 14歳 13
MMRMの仮定条件 ◆線形回帰の条件 1. 独立性:それぞれのデータが独立である →経時的反復測定データ(対応ありのデータ)は、この条件を満たさないが、 MMRMでは分散共分散構造で調整可能 2. 正規性:残差の分布が正規分布に従う →QQプロット:45度ラインに乗っているorランダムに散らばっている場合、 条件を満たす 3. 分散の一様性:残差の分布の分散が、Xの値によらず一定である →残差の分布を確認。一様にばらついている場合、条件を満たす 14
残差の分布 15
まとめ ◆ MMRMとは ①線形混合効果モデルの一種である ②欠測のある経時的反復データの解析モデルである(欠測がなくてもOK) ③ただし、全ての欠測に対して万能ではない→欠測はMARを仮定 ◆ MMRMはProc Mixedプロシジャで実行できる ◆ 固定効果の解の見方, P値の意味について解説した ◆ MMRMの仮定条件として、残差の分布の確認が大事 16
参考文献 • sas help:https://documentation.sas.com/doc/en/statcdc/14.2/statug/statug_mixed_toc.htm • sas help Example 78.2 Repeated Measures: • https://documentation.sas.com/doc/en/statcdc/14.2/statug/statug_mixed_examples02.htm • 日本製薬工業協会ほか,欠測のある連続量経時データに対する統計手法について,Ver2.0,2016. • (http://www.jpma.or.jp/medicine/shinyaku/tiken/allotment/pdf/statistics01.pdf) • 岸本淳司,PROC MIXED 入門,SASユーザー会論文集,1996. • 船渡川 伊久子ほか,母集団薬物動態解析の基礎:線形混合効果モデル・非線形混合効果モデルの数理,計量生物 学,36,S33-S48,2015. • 五所 正彦ほか,経時測定データ解析における mixed-effects models for repeated measures(MMRM)の利用,応用 統計学,46(2), 53-65,2017. • 石村貞夫ほか,入門はじめての統計推定と最尤法,東京都書,2010. • 馬場 真哉,平均・分散から始める一般化線形モデル入門,プレアデス出版,2015. • 松山 裕,経時観察研究における欠測データの解析,軽量生物学,25(2),89-116,2004. • 藤原 正和ほか,欠測のあるデータに対する解析手法の基礎~(2)主解析の検討~,計量生物セミナー,2015. • 竹ノ内 一雅ほか,臨床試験のestimandに対する最近の議論と,欠測のあるデータに対する基本的解析手法について,日 本製薬工業協会シンポジウム,2017. 17