3.5K Views
July 22, 23
スライド概要
研究室で開催した統計ゼミ2021の資料です。この資料では私が担当した統計的仮説検定について説明しています。
愛知工業大学でマルチエージェントシステムや空間分析を活用した減災に関する研究をしています。
伊藤暢浩研究室 統計ゼミ2021 統計的仮説検定 安藤 圭祐
2 はじめに 本講義の学習目的 研究者の主張を統計的に証明する方法である 統計的仮説検定の基本の理解 母平均を対象とした統計的仮説検定に関わる 計算・論証方法の習得 これまでに学んだ一部内容の振り返り
Ⅰ 統計的仮説検定の概要 3
4 統計的仮説検定の概要 エージェントの性能改善 例題 改修したエージェントの性能が向上したことを主張したい 対象 改修 偶然高い値になった? アンケート ・実験等 OR 観測 (平均得点) 𝜇 改修前 𝑥 ( > 𝜇) 改修後 性能が向上している?
5 統計的仮説検定の概要 統計的仮説検定 statistical hypothesis test データ・セットを用いて与えられた仮説が正しいかどうかを判断する統計手法 偶然高い値になった? OR 性能が向上している? 否定したい仮説 (主張の否定) 主張したい仮説 どちらか一方が 成立するとき 一方は成立しない 対立する二つの仮説から統計的に正しいと考えられる一方の仮説を選択
6 統計的仮説検定の概要 対立する二つの仮説 帰無仮説 𝐻0 null hypothesis 確率密度関数の変化 改修前 改修後 偶然高い値になった(主張の否定) 分布は変化していないが 確率的に稀有な値を観測 𝜇 𝑥 𝜇 𝑥 対立仮説 𝐻1 alternative hypothesis 性能が向上した(主張) 分布が変化して それに伴って値も変化
7 統計的仮説検定の概要 統計量の捉え方 𝐻0 を正しいと仮定したときにその統計量を得ることはどれほどの珍事かを考える 𝐻0 を正しいとしたときの 確率密度関数 𝑓(𝜃0 ) 𝐻1 を正しいとしたときの 確率密度関数𝑓(𝜃1 ) 𝑥 𝜇 𝑎 𝑏 𝑐 𝜇 からの距離 近い 𝑥 = 𝑎 のとき 分布の平均からは少しずれたが偶然の範囲内で𝐻0 は正しそう 𝑥 = 𝑏 のとき 偶然ともそうでないとも捉えられどちらが正しいとも言い難い 遠い 𝑥 = 𝑐 のとき 標本平均は偶然とは思えないぐらい大きく𝐻1 が正しそう
8 統計的仮説検定の概要 論証の枠組み 数学の背理法と同様に帰無仮説の真偽から対立仮説(主張)について論述 1 2 3 帰無仮説𝐻0 を正しいと仮定 その統計量を得たことが 偶然かどうかを判断 帰無仮説𝐻0 の判定から 対立仮説𝐻1 について結論 判断 これは偶然 これは珍事 𝐻0 は正しくないとは いえない 𝐻0 は正しくない 𝐻1 は正しい とはいえない 𝐻1 は正しい といえる
9 統計的仮説検定の概要 帰無仮説の真偽に対する判断基準 信頼率 有意水準 1−𝛼 𝛼 棄却 reject 仮説を正しくないと 否定すること 𝐻0 は正しくないとはいえない(採択) 𝐻0 は正しくない(棄却) 有意水準 𝛼 significance level 𝛼 帰無仮説𝐻0 を棄却する確率 実験者が任意に決定 一般に0.05、0.01をよく使用 100 × 𝛼%以下でしか発生しない 奇跡的な出来事は起きないと考える
10 統計的仮説検定の概要 統計的仮説検定のリスク 第一種の誤り 𝐻0 が正しいのに𝐻0 を棄却する誤り Type Ⅰ Error (実際には性能は向上していないが向上したとしてしまう ) 第二種の誤り 𝐻0 が正しくないのに𝐻0 を棄却しない誤り Type Ⅱ Error (実際には性能が向上しているが偶然の結果であったとしてしまう ) 第二種の誤りを犯す確率 第一種の誤りを犯す確率 (危険率) 有意水準と同じ確率 統計的仮説検定における論証は常に誤りを犯す可能性を持つ
統計的仮説検定の概要 基本的な用語の確認 1 統計的仮説検定で選択する主張したい仮説と その否定となる仮説の名称は? 2 帰無仮説が統計的仮説検定の結果として 否定されることを何というか? 3 統計的仮説検定において 「第一種の誤り」とはどのような誤りか? 11
Ⅱ 単純な統計的仮説検定問題の解法 12
単純な統計的仮説検定問題の解法 例題 ペンギンの体重測定 南極にあるパーマー諸島のアデリーペンギンの体重 は平均𝟑𝟕𝟎𝟎g、分散 𝟒𝟓𝟎 𝟐 であることが分かって いる。パーマー諸島にある島の一つであるビスコー でアデリーペンギンを𝟏𝟎頭調査したところ、その 平均は𝟑𝟒𝟓𝟓gであった。ビスコー島に生息するアデ リーペンギンは標準より小さいといえるか? 13
14 単純な統計的仮説検定問題の解法 仮説の設定 問題から 「ビスコーに生息するアデリーペンギンの大きさは標準より小さい」 と主張 帰無仮説 𝐻0 (主張の否定) 𝜇 ビスコ―に 生息する アデリー ペンギンの 体重の平均 = 3700 アデリー ペンギンの 体重の平均 対立仮説 𝐻1 (主張) 𝜇 ビスコ―に 生息する アデリー ペンギンの 体重の平均 < 3700 アデリー ペンギンの 体重の平均
15 単純な統計的仮説検定問題の解法 有意水準の設定 有意水準を 𝛼 = 0.05 と設定 下側確率5%の𝑧値は標準正規分布表から 𝑧𝛼 ≒ 1.64 標準正規分布 平均より「小さいか」どうかを 判定したいため 𝑁(0,1) 𝛼 = 0.05 𝑧 𝑧𝛼 ≒ 1.64
16 単純な統計的仮説検定問題の解法 統計量の算出 アデリーペンギンの体重の分布は𝑁 3700, 3402 体重の標本分布は𝑁 3700, 3402 /10 𝑋−𝜇 𝑇= ~ 𝑁(0,1) 𝜎/ 𝑛 3455 − 3700 𝑡= 450/ 10 ≒ −1.72 < −1.64 𝑁(0,1) 0.05 𝑇 −1.72 −1.64 平均が3455gとなる確率は5%未満
単純な統計的仮説検定問題の解法 結論 有意水準𝟎. 𝟎𝟓で帰無仮説𝐻0 は棄却され 「ビスコーのアデリーペンギンは標準より小さい」といえる 第一種の誤り・第二種の誤りがあることに注意 実際に例題ではわざと 偏りのある標本を作ってそのうえで作問しています (第一種の誤りがある) 17
単純な統計的仮説検定問題の解法 問題 製糸工場の新技術 ある工場で製造している糸の引張強度は平均 𝟒𝟎. 𝟎lbs、分散 𝟒. 𝟐𝟓 𝟐 であることがわかってい る。より丈夫な糸を作る新工法で𝟓𝟎本の標本を 調べたところ、平均𝟒𝟏. 𝟓lbsであった。新工法は 有効だといえるか?有意水準𝟏%で確かめよ。 18
19 単純な統計的仮説検定問題の解法 練習問題の論証手順 STEP 1. STEP 2. 仮説を立てる 統計量を計算する 𝑋−𝜇 𝑇= ~ 𝑁(0,1) 𝜎/ 𝑛 ある工場で製造している糸の引張強度 は平均𝟒𝟎. 𝟎lbs、分散 𝟒. 𝟐𝟓 𝟐 であるこ とがわかっている。より丈夫な糸を作 る新工法で 𝟓𝟎 本の標本を調べたところ、 平均𝟒𝟏. 𝟓lbsであった。新工法は有効だ STEP 3. 結論を述べる といえるか?有意水準𝟏%で確かめよ。
20 単純な統計的仮説検定問題の解法 練習問題の答え STEP 1. 仮説を立てる STEP 2. 統計量を計算する STEP 3. 結論を述べる 帰無仮説 対立仮説 𝐻0 : 𝜇 = 40.0 𝐻1 : 𝜇 > 40.0 𝑡= 41.5 − 40.0 4.25/ 50 ≒ 2.50 > 2.32 有意水準1%で𝐻0 は棄却される 「新工法は有効だ」といえる
Ⅲ 統計的仮説検定の基礎知識 21
22 統計的仮説検定の基礎知識 統計的仮説検定の一般的手順 一般的に統計的仮説検定を用い問題解決する場合は以下の手順を実施 本講義の問題で取り組む部分 問題から与えられている部分 STEP 1. 仮説の設定 STEP 5. 検定統計量と𝑝値の算出 STEP 2. 有意水準と棄却域の設定 STEP 6. 帰無仮説の判定 STEP 3. 標本サイズの計算 STEP 7. 結論 STEP 4. データの採取 STEP 8. 過誤についての言及
23 統計的仮説検定の基礎知識 STEP 1. 仮説の設定 仮説の対象 帰無仮説の例 母集団 分布 𝐻0 : 𝑋𝑖 ~𝑁 𝜇, 𝜎 2 母集団は正規分布𝑁 𝜇, 𝜎 2 に従う パラメータ 𝐻0 : 𝜇 = 𝜇0 平均値は𝜇0 である パラメータ parameter 母集団の分布を 特徴付ける特徴量 記号𝜃で表現 正規分布の平均𝜇 中心を特徴付ける 正規分布の分散𝜎 2 広がり具合を特徴付ける
24 統計的仮説検定の基礎知識 STEP 2. 有意水準と棄却域の設定 棄却域 the rejection region 有意水準とともに決定する 仮説𝐻を棄却する統計量𝑇の範囲𝐶 第一種の誤りを犯す範囲として 危険域とも呼ぶ 仮説𝐻のもとでの分布 有意水準 (危険率) 𝛼 統計量 𝑇 𝑇のある実現値𝑡について 𝑡∈𝐶 仮説𝐻は棄却される 𝑡∉𝐶 仮説𝐻は棄却されない 棄却域 𝐶 (危険域) 採択域 𝐶 𝑧𝛼
25 統計的仮説検定の基礎知識 STEP 2. 有意水準と棄却域の設定 対立仮説の立て方 ある帰無仮説𝐻0 : 𝜇 = 𝜇0 「糸の強さは平均𝜇0 である」に対しての 対立仮説𝐻1 は実験者の関心のあるところにより三通りの立て方が存在 主張 糸の強度は 𝜇0 より強い 糸の強度は 𝜇0 より弱い 糸の強度は 𝜇0 でない 仮説 𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0 呼称 右側検定 左側検定 片側検定 両側検定
26 統計的仮説検定の基礎知識 STEP 2. 有意水準と棄却域の設定 棄却域の種類 対立仮説の立て方により棄却域の取り方は以下のように異なる 右側検定 左側検定 𝛼 𝛼 𝛼/2 𝑇 採択域 [𝑧𝛼 , ∞) 棄却域 両側検定 𝛼/2 𝑇 棄却域 採択域 (−∞, 𝑧𝛼 ] 𝑇 棄却域 採択域 棄却域 (−∞, −𝑧𝛼/2 ] ∪ [𝑧𝛼/2 , ∞)
27 統計的仮説検定の基礎知識 STEP 3. 標本サイズの計算 標本サイズを事前に計算する理由 標本サイズが大きくするとどのような帰無仮説も棄却されてしまう 帰無仮説 𝐻0 : 𝜇 = 𝜇0 とすると 𝑥 − 𝜇0 𝑧 = = 𝜎/ 𝑛 𝑥 − 𝜇0 𝑛 𝜎 𝑧 𝑇 棄却の理由が分からなくなる 𝜇0 と𝑥に有意な差があるから 標本サイズが不適切であるから 𝑛の大きさに応じて 平均𝜇0 から遠ざかる 「標本サイズの設計」は理論の説明に時間を要するため、本講義では割愛
統計的仮説検定の基礎知識 STEP 5. 検定統計量と𝑝値の算出 検定統計量 test statistic 帰無仮説𝐻0 が正しいかどうかを判断するための値 問題の設定や仮説の対象に応じた様々な検定統計量が存在 分散が既知で母平均を検定する場合の検定統計量𝑇 𝑋−𝜇 𝑇=𝑍= ~ 𝑁(0,1) 𝜎/ 𝑛 𝑧検定 𝑧値(標準得点)を検定統計量の実現値とする統計的仮説検定 以降の講義ではいくつかの種類の検定統計量を使った検定を説明・練習 28
29 統計的仮説検定の基礎知識 STEP 5. 検定統計量と𝑝値の算出 𝑝値 𝑝-value 帰無仮説𝐻0 のもとで得られた検定統計量 が実現する確率 帰無仮説が棄却される最小の有意水準 有意確率(significant probability)ともいう 𝑝 𝛼 𝛼 𝑝 𝑡 仮説𝐻における𝑝値について 𝑝≤𝛼 𝑝>𝛼 𝑇 𝑇 𝑡 𝐻0 は棄却される 𝐻0 は棄却されない 𝑝 𝛼 棄却される 𝑝 𝛼 棄却されない
30 統計的仮説検定の基礎知識 STEP 7. 結論 帰無仮説が棄却されないときの結論の仕方 帰無仮説𝐻0 「新工法は有効でない」が棄却されないとき 積極的な判断 消極的な判断 (ダブル・ネガティブ) 新工法は有効でない 新工法は有効であるとはいえない と結論付ける 帰無仮説𝐻0 の採択は仮説を積極的に正しいと認めているわけではない
31 統計的仮説検定の基礎知識 STEP 7. 結論 検定の非対称性 asymmetry in hypothesis testing 帰無仮説が棄却されないとき消極的な判断しかできないこと 前提 𝐻0 を正しいと仮定 標本調査 棄却 𝐻0 に合致しない 𝐻0 に合致 前提に合致していない 標本(反例)がある 前提が誤っている ここで調べた標本が 合っていただけ 他も合うとは限らない 採択 帰無仮説が正しい というためには すべての標本について 正しいことを確認 しなければならない
統計的仮説検定の基礎知識 理解の確認 1 帰無仮説「ビスコーのペンギンは標準と同じサイズ」に 対しての対立仮説を三つ述べよ 2 ある仮説を証明するために必要な標本サイズは 適切でなければならない理由は何か? 3 帰無仮説「地球は青い」が棄却されなかったときの 結論を適切に述べよ 32
Ⅳ さまざまな検定統計量
34 さまざまな検定統計量 例題 前期演習時間の振り返り ある先生は長年2コマの演習形式の授業を二つの大学で担当している。各授業で 学生達は班単位で演習が終わり次第解散する。先生は参考として各班の演習時間 を常々記録していた。前期の演習時間をまとめたところ次のようになった。 場所 授業回数 平均演習時間(分) メモ A大学 𝟏𝟑 𝟏𝟔𝟓 流行感染症対策で2週分減 N大学 𝟏𝟓 𝟏𝟓𝟕 換気・座席配置等で対応 二つの大学で演習時間は差があるといえるか?先生の長年の記録よりA大学、N 大学それぞれの授業時間の標準偏差は𝟏𝟎分、𝟏𝟐分である。有意水準は𝟏%とする。
35 さまざまな検定統計量 2標本問題 二つの標本から異なる母集団に対して問題を設定 授業時間の 標準偏差 標本𝐴の 母集団 無作為抽出 A大学の 標本𝑋𝐴 𝜎𝐴 = 10 標本𝐵の 母集団 𝜎𝐵 = 12 授業回数 標本サイズ 平均授業時間 標本平均 𝑛𝐴 = 13 𝑥𝐴 = 165 𝑛𝐵 = 15 𝑥𝐵 = 157 N大学の 標本𝑋𝐵
36 さまざまな検定統計量 2標本の母平均に対する仮説の設定 二つの母平均に差があることを主張 授業時間の 授業時間の 平均(未知) 標準偏差 対立仮説 𝜇𝐴 標本𝐴の 母集団 𝜇𝐵 A大学の 標本𝑋𝐴 𝜎𝐴 = 10 標本𝐵の 母集団 𝐻1 : 𝜇𝐴 ≠ 𝜇𝐵 無作為抽出 𝜎𝐵 = 12 N大学の 標本𝑋𝐵
37 さまざまな検定統計量 2標本問題における等平均の検定 2標本問題も1標本問題と同様の手順で検定可能 仮説の設定 帰無仮説 母平均に差はない 𝐻0 : 𝜇𝐴 = 𝜇𝐵 対立仮説 母平均に差がある 𝐻1 : 𝜇𝐴 ≠ 𝜇𝐵 統計量の算出 帰無仮説の判定 等平均の𝑧検定統計量 分散が既知で二つの標本からその母平均に差が あるかどうかを調べる場合の統計検定量𝑇 𝑇= 𝑋𝐴 − 𝑋𝐵 𝜎𝐴2 𝜎𝐵2 + 𝑛𝐴 𝑛𝐵 ~ 𝑁(0,1)
38 さまざまな検定統計量 正規分布の再生性 reproductive property of the normal distribution 𝑁(𝜇𝐴 , 𝜎𝐴2 ) 2標本𝑋𝐴 と𝑋𝐵 がそれぞれ 𝑋𝐴 ~ 𝑁 𝜇𝐴 , 𝜎𝐴2 𝑋𝐵 ~ 𝑁(𝜇𝐵 , 𝜎𝐵2 ) 𝜇𝐴 𝑁(𝜇𝐵 , 𝜎𝐵2 ) であるとき 𝑋𝐴 + 𝑋𝐵 ~ 𝑁 𝜇𝐴 + 𝜇𝐵 , 𝜎𝐴2 + 𝜎𝐵2 𝑋𝐴 − 𝑋𝐵 ~ 𝑁(𝜇𝐴 − 𝜇𝐵 , 𝜎𝐴2 + 𝜎𝐵2 ) 2標本が正規分布に従うならば その和・差は正規分布に従う 𝜎𝐴 𝜇𝐵 𝜎𝐵 𝑁(𝜇𝐴 + 𝜇𝐵 , 𝜎𝐴2 + 𝜎𝐵2 ) 𝜇𝐴 + 𝜇𝐵 𝜎𝐴2 + 𝜎𝐵2
39 さまざまな検定統計量 等平均の検定統計量の求め方 正規分布の再生性 𝑋𝐴 ~ 𝑁(𝜇𝐴 , 𝜎𝐴2 /𝑛𝐴 ) 𝑵 𝝁𝑨 , 𝝈𝟐𝑨 から𝒏𝑨 個を 抽出した標本平均の分布 𝑋𝐵 ~ 𝑁(𝜇𝐵 , 𝜎𝐵2 /𝑛𝐵 ) 𝑋𝐴 − 𝑋𝐵 ~ 𝜎𝐴2 𝜎𝐵2 𝑁(𝜇𝐴 − 𝜇𝐵 , + ) 𝑛𝐴 𝑛𝐵 𝑵 𝝁𝑩 , 𝝈𝟐𝑩 から𝒏𝑩 個を 抽出した標本平均の分布 𝝁 𝝈𝟐 帰無仮説より 𝝁𝑨 = 𝝁𝑩 𝑋 − 𝜇 (𝑋𝐴 − 𝑋𝐵 ) − (𝜇𝐴 −𝜇𝐵 ) 𝑇= = ~ 𝑁(0,1) 𝜎/ 𝑛 𝜎𝐴2 𝜎𝐵2 + 𝒛検定統計量 𝑛𝐴 𝑛𝐵 𝑇= 𝑋𝐴 − 𝑋𝐵 𝜎𝐴2 𝜎𝐵2 + 𝑛𝐴 𝑛𝐵 ~ 𝑁(0,1)
40 さまざまな検定統計量 等平均の検定における論証の例解 STEP 1. 仮説を立てる STEP 2. 統計量を計算する STEP 3. 結論を述べる 帰無仮説 対立仮説 𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝐻1 : 𝜇𝐴 ≠ 𝜇𝐵 𝑡= 165 − 157 102 122 + 13 15 ≒ 1.92 < 2.32 有意水準1%で𝐻0 は棄却されない 「演習時間に差がある」とはいえない
41 さまざまな検定統計量 問題 臨床試験 ある感染症のワクチンの有効性を確認するために治験ボランティアを集めた。 ワクチン群とプラセボ (偽薬)群の血液検査 から右表のような結果 を得た。 群 人数 血清抗体価(AU/mL) ワクチン 𝟐𝟓 𝟏𝟗𝟎𝟎 プラセボ 𝟏𝟎 𝟏𝟒𝟎𝟎 このワクチンは有効といえるか?過去の研究結果から ワクチン群とプラセボ群の標準偏差は各々 𝟗𝟎𝟎 AU/mL、 𝟒𝟎𝟎AU/mlである。有意水準は𝟏%とする。
42 さまざまな検定統計量 練習問題の論証手順 STEP 1. STEP 2. 𝑇= STEP 3. 血液検査結果 仮説を立てる 統計量を計算する 𝑋𝐴 − 𝑋𝐵 ~ 𝑁(0,1) 群 人数 血清抗体価(AU/mL) ワクチン 𝟐𝟓 𝟏𝟗𝟎𝟎 プラセボ 𝟏𝟎 𝟏𝟒𝟎𝟎 𝜎𝐴2 𝜎𝐵2 + 𝑛𝐴 𝑛𝐵 ワクチン群、プラセボ群の標準偏差は 各々𝟗𝟎𝟎AU/mL、𝟒𝟎𝟎AU/ml 結論を述べる 有意水準は𝟏%
43 単純な統計的仮説検定問題の解法 練習問題の答え STEP 1. 仮説を立てる STEP 2. 統計量を計算する STEP 3. 結論を述べる 帰無仮説 対立仮説 𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝐻1 : 𝜇𝐴 > 𝜇𝐵 𝑡= 1900 − 1400 9002 4002 + 10 25 ≒ 2.27 < 2.32 有意水準1%で𝐻0 は棄却されない 「ワクチンが有効である」とは認められない
44 さまざまな検定統計量 例題 自宅周辺の雲量 気象に興味を持ち、自宅周辺の雲量を約2週間程測定したところその平 均は𝟔. 𝟎𝟒、分散は𝟐𝟐. 𝟑であった。同期間に気象庁で報告されている平 均雲量は𝟕. 𝟔𝟓である。気象庁で報告されている雲量は自宅周辺の雲量 とは異なるといえるか?有意水準𝟓%で確かめよ。 なお、雲量計がなかったた め雲量は撮影した空の写真 𝟏𝟕枚から機械的に推定した ものを利用している。 8/26 AM 8/26 PM 9/12 AM 5.87 7.72 10.0
45 さまざまな検定統計量 母分散が未知の場合における検定 例題や実際の問題では 母分散が不明 母分散の代わりに 不偏分散 を使用 1 𝑈2 = 𝑛−1 統計量は標準分布でなく 𝒕分布 に従う 𝑛 𝑋𝑘 − 𝑋 2 𝑘=1 標本値 標本平均 𝑇= 𝑥−𝜇 𝑈/ 𝑛 ~ 𝑡𝑛−1 自由度𝒏 − 𝟏の𝒕分布
46 さまざまな検定統計量 不偏分散の算出 標本値が与えられていれば平均との差から定義通りに算出 標本分散が与えられていれば以下の方法で算出 1 𝑈 = 𝑛−1 𝑛 2 𝑋𝑘 − 𝑋 𝑘=1 2 𝑛 1 = ∙ 𝑛−1 𝑛 17 𝑢 = ∙ 22.3 ≒ 23.7 17 − 1 2 推定した雲量の不偏分散 𝑛 𝑋𝑘 − 𝑋 𝑘=1 分散𝑆 2 2
47 さまざまな検定統計量 母分散が未知の検定における論証の例解 帰無仮説 STEP 1. 仮説を立てる STEP 2. 統計量を計算する 対立仮説 𝐻0 : 𝜇 = 7.65 𝑡= 𝐻1 : 𝜇 ≠ 7.65 6.04 − 7.65 23.7/17 ≒ −1.36 > 𝑡16 0.025 = −2.11 STEP 3. 結論を述べる 有意水準5%で𝐻0 は棄却されない 「気象庁の雲量と差がある」とはいえない
48 さまざまな検定統計量 スチューデントの𝑡検定 Student’s t-test 分散が未知で小標本の場合に用いる検定 (標本数が多い場合は𝑧検定を使用することもあり) 検定統計量として不偏分散を用いて求めた𝒕値を用いる検定 平均の検定(1標本𝒕検定) 𝑋−𝜇 𝑇= ~ 𝑡𝑛−1 𝑈/ 𝑛 2標本の𝒕検定では母分散が 等しいという仮定が必要 等平均の検定(2標本𝒕検定) 𝑇= 𝑋𝐴 − 𝑋𝐵 1 1 + 𝑈2 𝑛𝐴 𝑛𝐵 ~ 𝑡𝑚 where 𝑚 = 𝑛𝐴 + 𝑛𝐵 − 2
49 さまざまな検定統計量 プールした分散 pooled variance 2標本を扱うときの不偏分散 2標本をまとめたときの母分散の推定値 2 2 2 2 𝑛 − 1 𝑈 + (𝑛 − 1)𝑈 𝑛 𝑆 + 𝑛 𝑆 𝐴 𝐵 𝐴 𝐴 𝐵 𝐵 𝐴 𝐵 2 𝑈 = = (𝑛𝐴 − 1) + (𝑛𝐵 − 1) (𝑛𝐴 − 1) + (𝑛𝐵 − 1) 標本𝑿𝑨 の不偏分散𝑼𝟐𝑨 と 標本𝑿𝑩 の不偏分散𝑼𝟐𝑩 を按分 合併分散とも呼ばれる 𝑛 𝑆 2 より 𝑛−1 標本分散𝑺𝟐 からも計算可能 𝑈2 =
50 さまざまな検定統計量 母平均の検定統計量のまとめ 分散が既知 𝑧検定 1標本 2標本 𝑋−𝜇 𝑇= ~ 𝑁(0,1) 𝜎/ 𝑛 𝑇= 𝑋𝐴 − 𝑋𝐵 𝜎𝐴2 𝑛𝐴 + 𝜎𝐵2 𝑛𝐵 ~ 𝑁(0,1) 分散が未知 𝑡検定 𝑥−𝜇 𝑇= ~ 𝑡𝑛−1 𝑈/ 𝑛 𝑇= 𝑋𝐴 − 𝑋𝐵 1 1 + 𝑈2 𝑛𝐴 𝑛𝐵 ~ 𝑡𝑚 where 𝑚 = 𝑛𝐴 + 𝑛𝐵 − 2
51 さまざまな検定統計量 問題 満月の夜と狂気 西洋では月の満ち欠けは人の心に影響を与えるといわれる。満月の夜には人 の気が狂うことが古くから戯曲などで示されていたりする。本当だろうか? 1971年の調査によると1日平均入 院患者数が𝟏𝟏. 𝟐人であるのに対 し、𝟏𝟐回の満月の精神科緊急入 院患者数は右のようになった。 𝟓. 𝟎 𝟏𝟔. 𝟎 𝟏𝟐. 𝟎 𝟏𝟒. 𝟎 𝟏𝟑. 𝟎 𝟏𝟒. 𝟎 𝟏𝟑. 𝟎 𝟗. 𝟎 𝟏𝟑. 𝟎 𝟐𝟓. 𝟎 𝟔. 𝟎 𝟐𝟎. 𝟎 データから満月の夜の精神科緊急入院患者数が多いかどうかを確かめ、満月 の夜に人の気が狂うかどうかを調べよ。有意水準は𝟏%とする。
52 さまざまな検定統計量 練習問題の答え STEP 1. 仮説を立てる STEP 2. 統計量を計算する 帰無仮説 対立仮説 𝐻0 : 𝜇 = 11.2 𝐻1 : 𝜇 > 11.2 𝑡= 13.3 − 11.2 5.5 12 ≒ 1.32 < 𝑡11 (0.01) = 2.72 STEP 3. 結論を述べる 有意水準1%で𝐻0 は棄却されない 「満月の夜に人の気が狂う」とはいえない
53 さまざまな検定統計量 問題 雑草研究 夏の暮れにエノコログサをよく見かける。よく観察するとその穂は複数が一 つの根から飛び出していることがわかる。枝分かれした部分は側枝という。 散歩がてら近隣のエノコログサを調査する と側枝に付いた葉は3~5枚が多いことが分 かった。3枚と5枚のものを各々𝟏𝟏本ずつ 測った標本の平均と不偏分散を右に示す。 側枝・葉数ごとの穂長[cm]の統計量 葉 平均 不偏分散 3枚 𝟒. 𝟕𝟔 𝟒. 𝟖𝟐 𝟎. 𝟖𝟎 𝟐. 𝟏𝟔 5枚 葉の多い5枚の群は3枚の群より成長しているといえるだろうか?一般には多 くの光を吸収し成長が促進されていそうである。有効水準𝟓%で確認せよ。
54 さまざまな検定統計量 練習問題の答え STEP 1. 仮説を立てる 帰無仮説 対立仮説 𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝐻1 : 𝜇𝐴 < 𝜇𝐵 𝑡= STEP 2. 統計量を計算する 4.76 − 4.82 1 1 + 1.48 11 11 ≒ −0.116 > 𝑡20 0.05 = −1.72 STEP 3. 結論を述べる 有意水準1%で𝐻0 は棄却されない 「葉数3枚より5枚の方が成長している」とはいえない
55 おわりに より多くの統計解析手法を学ぶために YES 検定の対象パラメータは平均 分散は既知 𝒛検定 母分散は等しい 𝒕検定 標本は2群以下 本講義対象外の統計解析手法 手法自体は極めて多く存在 NO 考え方は 共通