9.6K Views
March 28, 24
スライド概要
[第9回大阪SAS勉強会] 杉本 真理
SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです
t検定の基礎 (Studentのt検定とWelchのt検定) 大阪SAS勉強会 2024/3/22 エイツーヘルスケア株式会社 杉本真理 © A2 Healthcare Corporation Confidential
Contents 1 © A2 Healthcare Corporation Confidential 検定とは 2 SASによる 検定の実行方法 3 検定の頑健性 2
1 検定とは © A2 Healthcare Corporation Confidential 3
検定とは 検定:平均値の差に関する検定 1標本の 検定:母平均が特定の値と異なるかどうかを検定する 例) 帰無仮説H₀:A組の数学の平均点は60点ではない 対立仮説H₁:A組の数学の平均点は60点である 2標本の 検定:2群の母平均が等しいか否かを検定する 例) 帰無仮説H₀:A組とB組の数学の平均点に差はない 対立仮説H₁:A組とB組の数学の平均点に差はある © A2 Healthcare Corporation Confidential 4
検定とは 対応のあるデータ 対応のないデータ 同一の対象から抽出された データ 異なる対象から抽出された データ VS 治験薬投与前 の血圧 治験薬A投与群 の血圧 治験薬投与後 の血圧 VS 治験薬B投与群 の血圧 © A2 Healthcare Corporation Confidential 5
2群のデータの分布 (ⅰ)平均も分散も同じ © A2 Healthcare Corporation Confidential (ⅱ)平均は同じ 分散は異なる (ⅲ)分散は同じ 平均は異なる 6 (ⅳ)平均も分散も異なる
Studentの 検定 Studentの 検定:2群の母分散が未知で等しいと仮定した場合 (ⅰ)平均も分散も同じ © A2 Healthcare Corporation Confidential (ⅱ)平均は同じ 分散は異なる (ⅲ)分散は同じ 平均は異なる 7 (ⅳ)平均も分散も異なる
Welchの 検定 Welchの 検定:2群の母分散が未知で等しいと仮定しない場合 (ⅰ)平均も分散も同じ © A2 Healthcare Corporation Confidential (ⅱ)平均は同じ 分散は異なる (ⅲ)分散は同じ 平均は異なる 8 (ⅳ)平均も分散も異なる
2標本の 検定 Yes 対応のある 検定 対応のある 2群か? Yes No 母集団の分散は 等しいか? No © A2 Healthcare Corporation Confidential Studentの 検定 9 Welchの 検定
検定、どんなことしてるの? 中心極限定理 平均 、分散 ²に従う母集団からサンプルサイズ の標本を抽出する 場合、その平均値 の分布は、 が大きくなるにつれて、平均値 、 ² 分散 の正規分布に収束する 標本平均を 算出 標本を𝒏回 抽出 母集団 𝑁(𝜇, 𝜎²) 標本平均の分布 𝝈² 𝑁(𝜇 , ) 𝒏 ・・・ © A2 Healthcare Corporation Confidential 𝑥 10 𝑥̅
検定、どんなことしてるの? 標本平均の分布 標準正規分布 𝑧 標準化 𝑥̅ © A2 Healthcare Corporation Confidential 11
検定、どんなことしてるの? 標本平均の分布 分布 nが十分に大きくない場合に、 標本分散の期待値は母分散に 一致せず、母分散より小さく なる。 ↓ 不偏分散 標準化 標本分散の期待値が母分散に一 致するように標本分散の算出式 に をかけたもの 𝒏 𝒊 1標本の場合 𝒊 𝟏 © A2 Healthcare Corporation Confidential 12
分布 分布:自由度 -1を パラメータとする確率分布 自由度が大きくなると、標準 正規分布に近づく →サンプルサイズが十分に大きければ、 分布でも標準正規分布でも結果は ほとんど変わらない 自由度1: 自由度2: 自由度5: 自由度10: 標準正規分布: © A2 Healthcare Corporation Confidential 13
分布 分布:自由度 -1を パラメータとする確率分布 分布は標準正規分布に比べ、 左右に広がる裾が厚い →同じ確率密度になるような値を とったときに、 分布の方が信頼 区間の幅が広くなる -4.30 抽出するサンプル数が 少なくても、正確に 母平均の推定が可能 © A2 Healthcare Corporation Confidential -1.96 自由度2: 標準正規分布: 14 1.96 4.30
検定(両側)を行う ① ② ③ ④ ⑤ ⑥ 帰無仮説、対立仮説をたてる。 有意水準 の設定を行う。 検定統計量( 値)を算出する。 自由度 を算出する。 分布表から、自由度 、②で定めた有意水準の時の値を求める。 帰無仮説の判定をする。 例)実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目 実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 © A2 Healthcare Corporation Confidential 15
検定(両側)を行う 例)実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目 実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ① 帰無仮説、対立仮説をたてる。 帰無仮説H₀:実薬群、対照薬群の収縮期血圧の平均値に差はない 対立仮説H₁:実薬群、対照薬群の収縮期血圧の平均値は異なる ② 有意水準 の設定を行う。 両側有意水準 =0.05とする。 © A2 Healthcare Corporation Confidential 16
検定(両側)を行う 「母分散は等しい」 例)実薬群、対照薬群の収縮期血圧の平均値に差はあるのか と仮定しているため、 1人目 2人目 3人目2つの標本を1つにまとめた分散 4人目 5人目 6人目 7人目 8人目 (プールした分散)を用いる 9人目 10人目 実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ③ 検定統計量( 値)を算出する。(1:実薬群 2:対照薬群) 【Studentの 検定】 𝟏 (𝒏𝟏 ( 𝟏 ∑ 𝒙𝟏 𝒊 = © A2 Healthcare Corporation Confidential 𝟐 𝟏 𝒏𝟐 【Welchの 検定】 𝟏 ) 𝟐 𝝈𝟐 𝟏 𝒏𝟏 𝒙𝟏 ² ∑(𝒙𝟐 𝒊 𝒙𝟐 )² ) 𝒏𝟏 𝒏𝟐 𝟐 17 𝟐 𝝈𝟐 𝟐 𝒏𝟐
検定(両側)を行う 例)実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目 実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ③検定統計量( 値)を算出する。(1:実薬群 2:対照薬群) 平均値 𝟏 不偏分散 平均値 𝟐 不偏分散 © A2 Healthcare Corporation Confidential 𝟐 𝟏 (153+153+157+…+157)/ 10 = 152.9 (153-152.9)²+…+(157-152.9)² / 9 ≒ 10.3 𝟐 𝟐 (153+146+138+…+153)/ 10 = 147.3 (153-143.2)²+…+(153-143.2)² / 9 ≒ 37.1 18
検定(両側)を行う 例)実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目 実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ③ 検定統計量( 値)を算出する。(1:実薬群 2:対照薬群) 【Studentの 検定】 【Welchの 検定】 𝒙𝟏 𝒙𝟐 (𝒏𝟏 𝟏 ( 𝟏 𝒏𝟐 𝟏 )𝝈𝟐 𝟐 𝟏 𝟏 ∑ 𝒙𝟏 𝒊 𝒙𝟏 ² ∑(𝒙𝟐 𝒊 𝒙𝟐 )² = ) 𝒏𝟏 𝒏𝟐 𝟐 . . © A2 Healthcare Corporation Confidential . 19 . 𝟐 𝟐 𝟐 𝟐
検定(両側)を行う 例)実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目 実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ④ 自由度 を算出する。(1:実薬群 2:対照薬群) 【Studentの 検定】 【Welchの 検定】 𝟐 𝝈𝟐 𝝈 𝟏 𝟐 𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝝈𝟐 𝝈 𝟏 ( )𝟐 ( 𝟐 )𝟐 𝒏𝟏 𝒏𝟐 (𝒏𝟏 𝟏) (𝒏𝟐 𝟏) © A2 Healthcare Corporation Confidential 20 . ( ( ( . . ) ( ) ( ) . ) )
検定(両側)を行う 分布表から、有意水準 、自由度 の時の値を求める。 𝑣 【Studentの 検定】 両側有意水準 =0.05 自由度 =18 値= 2.571 【Welchの 検定】 両側有意水準 =0.05 自由度 =13.65 値= 2.572 © A2 Healthcare Corporation Confidential 21 𝛼 0.1 0.05 0.025 0.01 0.005 1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925 3 1.638 2.353 3.182 4.541 5.841 4 1.533 2.132 2.776 3.747 4.604 5 1.476 2.015 2.571 3.365 4.032 6 1.440 1.943 2.447 3.143 3.707 7 1.415 1.895 2.365 2.998 3.499 8 1.397 1.860 2.306 2.896 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.812 2.228 2.764 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845
検定(両側)を行う ⑥ 帰無仮説の判定をする。 【Studentの 検定】 有意水準 =0.05 自由度 =18 値= 2.571 →2.571≧2.101 【Welchの 検定】 有意水準 =0.05 自由度 =13.65 値= 2.572 →2.572≧2.160 © A2 Healthcare Corporation Confidential 𝛼 𝑣 棄却域 棄却域 -2.101 棄却域 2.101 2.571 棄却域 -2.160 2.160 2.572 22 0.1 0.05 0.025 0.01 0.005 1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925 3 1.638 2.353 3.182 4.541 5.841 4 1.533 2.132 2.776 3.747 4.604 5 1.476 2.015 2.571 3.365 4.032 6 1.440 1.943 2.447 3.143 3.707 7 1.415 1.895 2.365 2.998 3.499 8 1.397 1.860 2.306 2.896 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.812 2.228 2.764 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845
検定(両側)を行う ⑥ 帰無仮説の判定をする。 𝛼 𝑣 0.1 0.05 0.025 0.01 1 3.078 6.314 12.706 31.821 【Studentの 検定】 2 1.886 2.920 4.303 6.965 3 1.638 2.353 3.182 4.541 有意水準 =0.05 4 1.533 2.132 2.776 3.747 棄却域 棄却域 5 1.476 2.015 2.571 3.365 自由度 =18 6 1.440 1.943 2.447 3.143 値= 2.571 7 1.415 1.895 2.365 2.998 -2.101 2.101 8 1.397 1.860 2.306 2.896 2.571 帰無仮説H₀:実薬群、対照薬群の収縮期血圧の平均値に差はない →2.571≧2.101 9 1.383 1.833 2.262 2.821 10 1.372 1.812 2.228 2.764 対立仮説H₁:実薬群、対照薬群の収縮期血圧の平均値は異なる 【Welchの 検定】 有意水準 =0.05 自由度 =13.65 値= 2.572 →2.572≧2.160 © A2 Healthcare Corporation Confidential 棄却域 棄却域 -2.160 2.160 2.572 23 0.005 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845
2 SASによる 検定の実行方法 © A2 Healthcare Corporation Confidential 24
ttestプロシジャ proc ttest data=data; class ARM; var AVAL; run; Studentのt検定 Welchのt検定 © A2 Healthcare Corporation Confidential 25
glmプロシジャ proc glm data=data; class ARM; model AVAL = ARM; lsmeans ARM / tdiff = control("対照群") cl; quit; Welchのt検定も選択可能 proc glm data=data; class ARM; model AVAL = ARM ; means ARM /welch; quit; © A2 Healthcare Corporation Confidential 26
mixedプロシジャ proc mixed data = data ; class ARM; model AVAL = ARM ; lsmeans ARM / pdiff = control("対照群") cl; run ; © A2 Healthcare Corporation Confidential 27
3 検定の頑健性 © A2 Healthcare Corporation Confidential 28
Studentの 検定 vs Welchの 検定 デフォルトでWelchの t検定のほうが良い? 下記状況の2群について、各群のサンプルサイズが同じ、または、異なる 場合に、Studentの 検定 とWelchの 検定をそれぞれ1000回実施し、 各検定が帰無仮説を棄却した割合を算出する (ⅰ)平均も分散も同じ (ⅱ)平均は同じ 標準偏差は異なる (ⅲ)標準偏差は同じ 平均は異なる (ⅳ)平均も標準偏差も異なる 帰無仮説H₀:実薬群、対照薬群の収縮期血圧の平均値に差はない 対立仮説H₁:実薬群、対照薬群の収縮期血圧の平均値は異なる © A2 Healthcare Corporation Confidential 29
Studentの 検定 vs Welchの 検定 表1.平均、標準偏差ともに等しい場合のStudentの𝑡検定およびWelchの𝑡検定 の棄却割合(シミュレーション回数:1000回) サンプルサイズ 平均 標準偏差 Studentの Welchの 実薬群 対照薬群 実薬群 対照薬群 実薬群 対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 0 1 1 6.30 6.30 10 10 0 0 1 1 5.20 5.10 サンプルサイズは異なる 200 100 0 0 1 1 4.20 4.20 20 10 0 0 1 1 5.30 5.10 © A2 Healthcare Corporation Confidential 30 Studentの 検定 サンプルサイズの違い に関係なく、 αエラーは、5%程度 Welchの 検定 サンプルサイズの違い に関係なく、 αエラーは、5%程度
Studentの 検定 vs Welchの 検定 表2.平均は同じ場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合 (シミュレーション回数:1000回) サンプルサイズ 平均 標準偏差 Studentの Welchの 実薬群 対照薬群 実薬群 対照薬群 実薬群 対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズが等しい 100 100 0 0 1 0.25 5.10 4.90 100 100 0 0 1 0.5 5.30 5.10 100 100 0 0 1 2 5.50 5.50 100 100 0 0 1 4 6.50 6.40 10 10 0 0 1 0.25 6.00 5.20 10 10 0 0 1 0.5 4.70 4.50 10 10 0 0 1 2 6.90 6.40 10 10 0 0 1 4 7.50 6.80 サンプルサイズが異なる 200 100 0 0 1 0.25 0.90 4.80 200 100 0 0 1 0.5 2.00 4.30 200 100 0 0 1 2 11.00 4.80 200 100 0 0 1 4 15.90 4.60 20 10 0 0 1 0.25 1.50 6.10 20 10 0 0 1 0.5 2.40 6.00 20 10 0 0 1 2 10.90 5.00 20 10 0 0 1 4 16.10 5.00 © A2 Healthcare Corporation Confidential 31 Studentの 検定 サンプルサイズが異なり、 標準偏差の差が大きいほど、 αエラーは大きくなる Welchの 検定 サンプルサイズ、標準偏差 の違いに関係なく、 αエラーは、5%程度
Studentの 検定 vs Welchの 検定 表3.標準偏差は同じ場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合 (シミュレーション回数:1000回) サンプルサイズ 平均 標準偏差 Studentの Welchの 実薬群 対照薬群 実薬群 対照薬群 実薬群 対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 0.5 1 1 94.50 94.50 100 100 0 1 1 1 100.00 100.00 100 100 0 2 1 1 100.00 100.00 100 100 0 4 1 1 100.00 100.00 10 10 0 0.5 1 1 18.60 18.20 10 10 0 1 1 1 56.50 56.10 10 10 0 2 1 1 99.30 99.30 10 10 0 4 1 1 100.00 100.00 サンプルサイズは異なる 200 100 0 0.5 1 1 98.40 98.30 200 100 0 1 1 1 100.00 100.00 200 100 0 2 1 1 100.00 100.00 200 100 0 4 1 1 100.00 100.00 20 10 0 0.5 1 1 24.80 24.30 20 10 0 1 1 1 69.80 68.50 20 10 0 2 1 1 100.00 99.90 20 10 0 4 1 1 100.00 100.00 © A2 Healthcare Corporation Confidential 32 Studentの 検定 サンプルサイズが小さく、 平均の差も小さいと検出力は 下がる Welchの 検定 サンプルサイズが小さく、 平均の差も小さいと検出力は 下がる
Studentの 検定 vs Welchの 検定 表4.平均、分散ともに異なる場合のStudentの𝑡検定およびWelchの𝑡検定の 棄却割合(シミュレーション回数:1000回) サンプルサイズ 平均 標準偏差 Studentの Welchの 実薬群 対照薬群 実薬群 対照薬群 実薬群 対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 2 1 0.25 100.00 100.00 100 100 0 2 1 0.5 100.00 100.00 100 100 0 2 1 2 100.00 100.00 100 100 0 2 1 4 99.70 99.70 10 10 0 2 1 0.25 100.00 100.00 10 10 0 2 1 0.5 100.00 100.00 10 10 0 2 1 2 74.50 73.00 10 10 0 2 1 4 31.10 27.40 サンプルサイズは異なる 200 100 0 2 1 0.25 100.00 100.00 200 100 0 2 1 0.5 100.00 100.00 200 100 0 2 1 2 100.00 100.00 200 100 0 2 1 4 99.80 99.80 20 10 0 2 1 0.25 100.00 100.00 20 10 0 2 1 0.5 100.00 100.00 20 10 0 2 1 2 89.50 77.10 20 10 0 2 1 4 54.00 29.30 © A2 Healthcare Corporation Confidential 33 Studentの 検定 サンプルサイズが小さく、 標準偏差の差が大きいと 検出力は下がる Welchの 検定 サンプルサイズが小さく、 標準偏差の差が大きいと Studentのt検定よりも顕著に 検出力は下がる
Studentの 検定 vs Welchの 検定 表4.平均、分散ともに異なる場合のStudentの𝑡検定およびWelchの𝑡検定の 棄却割合(シミュレーション回数:1000回) サンプルサイズ 平均 標準偏差 Studentの Welchの 実薬群 対照薬群 実薬群 対照薬群 実薬群 対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 0.5 1 0.25 100.00 100.00 100 100 0 0.5 1 0.5 99.50 99.50 100 100 0 0.5 1 2 61.80 61.60 100 100 0 0.5 1 4 24.30 24.30 10 10 0 0.5 1 0.25 32.00 29.30 10 10 0 0.5 1 0.5 28.20 27.10 10 10 0 0.5 1 2 10.80 9.90 10 10 0 0.5 1 4 8.40 7.30 サンプルサイズは異なる 200 100 0 0.5 1 0.25 100.00 100.00 200 100 0 0.5 1 0.5 100.00 100.00 200 100 0 0.5 1 2 75.70 64.20 200 100 0 0.5 1 4 40.70 22.70 20 10 0 0.5 1 0.25 28.60 53.30 20 10 0 0.5 1 0.5 27.00 42.50 20 10 0 0.5 1 2 21.40 10.60 20 10 0 0.5 1 4 19.30 6.40 © A2 Healthcare Corporation Confidential 34 Studentの 検定 分散の差が大きいと 検出力は下がる サンプルサイズが小さく、 分散の差が大きいと さらに検出力は下がる Welchの 検定 分散の差が大きいと 検出力は下がる サンプルサイズが小さく、 分散の差が大きいと Studentのt検定よりも顕著に 検出力は下がる
Studentの 検定 vs Welchの 検定 表4.平均、分散ともに異なる場合のStudentの𝑡検定およびWelchの𝑡検定の 棄却割合(シミュレーション回数:1000回) サンプルサイズ 平均 標準偏差 Studentの Welchの 実薬群 対照薬群 実薬群 対照薬群 実薬群 対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 1 1 0.25 100.00 100.00 100 100 0 1 1 0.5 100.00 100.00 100 100 0 1 1 2 99.10 99.10 100 100 0 1 1 4 68.70 68.30 10 10 0 1 1 0.25 83.00 79.00 10 10 0 1 1 0.5 77.50 75.10 10 10 0 1 1 2 26.80 25.20 10 10 0 1 1 4 12.50 11.30 サンプルサイズは異なる 200 100 0 1 1 0.25 100.00 100.00 200 100 0 1 1 0.5 100.00 100.00 200 100 0 1 1 2 99.80 99.50 200 100 0 1 1 4 83.40 67.40 20 10 0 1 1 0.25 90.70 98.80 20 10 0 1 1 0.5 85.80 94.20 20 10 0 1 1 2 45.50 28.00 20 10 0 1 1 4 28.30 11.20 © A2 Healthcare Corporation Confidential 35 Studentの 検定 分散の差が大きいと 検出力は下がる サンプルサイズが小さく、 分散の差が大きいと さらに検出力は下がる Welchの 検定 分散の差が大きいと 検出力は下がる サンプルサイズが小さく、 分散の差が大きいと Studentのt検定よりも顕著に 検出力は下がる
Studentの 検定 vs Welchの 検定 表4.平均、分散ともに異なる場合のStudentの𝑡検定およびWelchの𝑡検定の棄 却割合(シミュレーション回数:1000回) サンプルサイズ 平均 標準偏差 Studentの Welchの 実薬群 対照薬群 実薬群 対照薬群 実薬群 対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 4 1 0.25 100.00 100.00 100 100 0 4 1 0.5 100.00 100.00 100 100 0 4 1 2 100.00 100.00 100 100 0 4 1 4 100.00 100.00 10 10 0 4 1 0.25 100.00 100.00 10 10 0 4 1 0.5 100.00 100.00 10 10 0 4 1 2 99.90 99.90 10 10 0 4 1 4 81.80 78.70 サンプルサイズは異なる 200 100 0 4 1 0.25 100.00 100.00 200 100 0 4 1 0.5 100.00 100.00 200 100 0 4 1 2 100.00 100.00 200 100 0 4 1 4 100.00 100.00 20 10 0 4 1 0.25 100.00 100.00 20 10 0 4 1 0.5 100.00 100.00 20 10 0 4 1 2 100.00 100.00 20 10 0 4 1 4 94.30 79.00 © A2 Healthcare Corporation Confidential 36 Studentの 検定 サンプルサイズが小さく、 分散の差が大きいと 検出力は下がる Welchの 検定 サンプルサイズが小さく、 分散の差が大きいと Studentのt検定よりも顕著に 検出力は下がる
Studentの 検定 vs Welchの 検定 サンプルサイズ 大きい 等しい 小さい 大きい 異なる 小さい 標準偏差 αエラー Studentの Welchの𝑡検定 𝒕検定 等しい ー ー ー ー ー ↑ ー ー ー ー ー ー ー ー 異なる ↑ ー 等しい 異なる 等しい 異なる 等しい 異なる Studentの 検定において、サンプルサイズ、標準偏差が異なる場合、標準偏差の差が 大きくなるほど、αエラーが大きくなる →Studentの 検定は、標準偏差の違いに頑健性がない © A2 Healthcare Corporation Confidential 37
Studentの 検定 vs Welchの 検定 サンプルサイズ 大きい 等しい 小さい 大きい 異なる 小さい 標準偏差 検出力 Studentの Welchの𝒕検定 𝑡検定 等しい ー ー ー ↓ ー ー ー 異なる ↓ 等しい 異なる 等しい 異なる 等しい 異なる ー ー ー ↓ ー ー ー ↓ サンプルサイズが小さく、標準偏差の差が大きい場合、Welchの 検定、 Studentの 検定 共に検出力が低下する。 加えて、サンプルサイズが異なる場合、Welchの 検定は、 Studentの 検定と比較して、 顕著に検出力が低下する。 → Welchの 検定は、サンプルサイズの大きさ、違いに頑健性がない © A2 Healthcare Corporation Confidential 38
Studentの 検定 vs Welchの 検定 サンプルサイズ 標準偏差 検出力 Studentの Welchの𝒕検定 𝑡検定 ー ー 異なる ー ー 等しい 等しい ー ー 小さい 異なる ↓ ↓ 等しい ー →Welchの 検定がStudentの ー 検定と比較して、 大きい 異なる ー ー 異なる 必ずしも頑健であるとは言えない 等しい ー ー 大きい 小さい 等しい 異なる ↓ ↓ サンプルサイズが小さく、標準偏差の差が大きい場合、Welchの 検定、 Studentの 検定 共に検出力が低下する。 加えて、サンプルサイズが異なる場合、Welchの 検定は、 Studentの 検定と比較して、 顕著に検出力が低下する。 → Welchの 検定は、サンプルサイズの大きさ、違いに頑健性がない © A2 Healthcare Corporation Confidential 39
まとめ Studentの 検定(等分散性を仮定する):分散の違い Welchの 検定(等分散性を仮定しない):サンプルサイズの大きさ、違い に頑健性がない →場合により、Welchの 検定、Studentの 検定を使い分ける必要がある 検定をSASで実行する場合、ttestプロシジャが使用できる また、glmプロシジャやmixedプロシジャを使用することもできる © A2 Healthcare Corporation Confidential 40
参考文献 MIXED.pdf (osaka-u.ac.jp) 【SAS】分散分析 | Data Science Blog (clear-data-science-blog.com) PROC GLM: Randomized Complete Blocks with Means Comparisons and Contrasts :: SAS/STAT(R) 9.3 User's Guide Technical Support (sas.com) t分布を超わかりやすく解説(t分布で区間推定!)【統計学入門26】 (datawokagaku.com) 坂巻顕太朗. “第15回 無計画な解析における問題”. 生物統計学の道標.一般財団法人 厚生労働統計協会, 2023, 149154 田中豊、中西寛子、姫野哲人、酒折文武、山本義郎. 改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎, 2018, 150-154 229-230 宮岡悦良、吉澤敦子.データ解析のためのSAS統計入門.株式会社朝倉書店, 2008, 178 316-317 吉村功.毒性・薬効データの統計解析ー事後研究によるアプローチー.株式会社サイエンティスト社, 2005, 30-34 小島寛之.完全独習統計学入門.ダイヤモンド社, 2022, 180-187 Reporting degrees of freedom for Welch t-test - Cross Validated (stackexchange.com) © A2 Healthcare Corporation Confidential 41
データサイエンス本部 杉本真理 0 3- 38 3 0 -11 22 /[email protected] 〒112-0002 東京都文京区小石川 1-4-1住友不動産後楽園ビル 20F(総合受付) http://www.a2healthcare.com/