経営統計_11_統計的仮説検定の例

7.2K Views

January 05, 24

#統計的仮説検定 #平均値の検定 #t検定 #正規分布 #p値

スライド概要

神戸大学経営学部で2022年度より担当している「経営統計」の講義資料「11_統計的仮説検定の例」を公開用に調整したものです。
【変更履歴】
・2026/05/09：表現の微修正（pp. 19, 36）

Kyosuke Bunji

@BunjiRo

スライド一覧

神戸大学経営学研究科准教授　分寺杏介（ぶんじ・きょうすけ）です。主に心理学的な測定・教育測定に関する研究を行っています。講義資料や学会発表のスライドを公開していきます。 ※スライドに誤りを見つけた方は，炎上させずにこっそりお伝えいただけると幸いです。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

ベイズ統計_07_マルコフ連鎖モンテカルロ法(2)

Kyosuke Bunji 69.6K

ベイズ統計_02_確率の基本とベイズの定理

Kyosuke Bunji 56.4K

ベイズ統計_01_イントロダクション

Kyosuke Bunji 49.6K

ベイズ統計_03_尤度

Kyosuke Bunji 47.7K

ベイズ統計_04_事前分布・基本的なベイズ推論(1)

Kyosuke Bunji 46K

ベイズ統計_06_マルコフ連鎖モンテカルロ法(1)

Kyosuke Bunji 44.4K

各ページのテキスト

経営統計 11 統計的仮説検定の例分寺杏介神戸大学経営学部  [email protected] ※本スライドは，クリエイティブ・コモンズ表示-非営利 4.0 国際ライセンス（CC BY-NC 4.0）に従って利用が可能です。

https://creativecommons.org/licenses/by-nc/4.0/

前回のおさらい細かい書き方は教科書によって異なるので基本的な流れだけは理解しておいてください。 1 仮説を設定する検定の種類によって使用する検定統計量その確率分布が異なる ▼ すべて覚えるのは無理 ▼ 基本的な流れだけ頭に叩き込んでおく ▼ あとは必要に応じて調べながらやるだけ 2 帰無仮説が正しいときの検定統計量の分布を考える 3 標本から得られた検定統計量の値の起こりやすさを考える 4 帰無仮説を棄却するかを判断する今回は具体的な仮説検定の流れをひたすら紹介していきますということで以後はほぼ同じフォーマットを繰り返していきます 11 統計的仮説検定の例 2

平均値の検定 11 統計的仮説検定の例 3

平均値の検定問ある会社では電球を作っています。今年度からSDGsの煽りを受けて一部の素材を再資源化されたものに切り替えました。変更した素材が電球の寿命に影響を及ぼさないか確認するため，ランダムに25個の電球を取り出してテストを行いました。その結果，新しい電球の寿命は平均で1960時間となりました。ちなみに，素材変更前の電球は，その寿命が平均2000時間，標準偏差100時間でした。さて，この電球の寿命は従来のものより短くなっているでしょうか？統計的に検証してください。旧平均2000時間素材の一部に空き缶を再利用 SDGs 11 統計的仮説検定の例新まあ誤差ってことで見なかったことにするか… 平均1960時間 4

平均値の検定 1 仮説を設定する ▌まずは母集団分布を仮定する母集団分布の仮定は問題設定に含まれていることもありますが特に指定がない場合には自分で考える必要があります。電球の耐久時間は正規分布に従うはず（そう仮定しても問題ないだろう） ▌どのパラメータが検証の対象かをはっきりさせておくとよい母集団分布が正規分布ならば… 新しい電球の寿命の分布 𝑁 𝜇, 1002 もちろん電球の寿命には個体差があるが，平均的には従来と同じ2000時間ならばとりあえず問題はないと言えそう 𝑁 𝜇, 𝜎 2 の 𝜇 が2000かどうかを検定するここでは一旦標準偏差を過去の結果と同じ100時間としておきます 11 統計的仮説検定の例 5

平均値の検定 1 仮説を設定する ▌まずは母集団分布を仮定する母集団分布の仮定は問題設定に含まれていることもありますが特に指定がない場合には自分で考える必要があります。電球の耐久時間は正規分布に従うはず ▌どのパラメータが検証の対象かをはっきりさせておくとよい母集団分布が正規分布ならば， 𝑁 𝜇, 1002 の 𝜇 に関心がある今回は両側検定にしておきます【実際に検証したいこと】平均寿命は2000時間ではない 𝜇 ≠ 2000 alternative hypothesis 現実にはどちらか一方だけが正しい対立仮説 11 統計的仮説検定の例【の逆】平均寿命は2000時間である 𝜇 = 2000 null hypothesis 帰無仮説 6

平均値の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌検定統計量は推定のときと同じ考え方で母平均の検定の場合は，標本平均を用いて考えたら良い平均寿命は2000時間である 𝜇 = 2000 𝑁 2000, 202 帰無仮説の元での分布 null hypothesis 帰無仮説帰無分布こちらが正しい場合 25個体（標本）での寿命の標本平均は 𝑋ത ∼ 𝑁 1002 2000, 25 = 𝑁 2000, 202 に従う 11 統計的仮説検定の例 7

平均値の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑁 2000, 202 ▌両側検定正規分布 𝑋ത ∼ 𝑁 2000, 202 において標本平均が1960時間よりも極端になる確率は極端に低い 𝑃 𝑋ത ≤ 1960 極端に高い + 𝑃(𝑋ത ≥ 2040) 標準化したら極端に低い 1960 − 2000 ҧ 𝑃 𝑍≤ 20 極端に高い 2040 − 2000 ҧ + 𝑃 𝑍≥ 20 11 統計的仮説検定の例どうせ標準化するので初めから検定統計量を 𝑍ҧ とすることも多い 𝑍ҧ ∼ 𝑁(0,1) 8

平均値の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑁 0, 1 ▌両側検定正規分布 𝑋ത ∼ 𝑁 2000, 202 において 𝜇 = 2000 の場合 25個体での標本平均が 2000時間から40時間以上ずれる確率はおよそ4.55% 𝑃 𝑍ҧ ≤ −2 𝑃 𝑍ҧ ≥ 2 𝑝 = 0.0455 4 帰無仮説を棄却するかを判断する 25個体の平均が1960時間というのは 𝜇 = 2000 だとすると結構レアなこと 𝑝 < 𝛼 のため帰無仮説が間違っていると言えそう（棄却する） 11 統計的仮説検定の例耐久性下がってますよ！元の素材に戻すべきだ！問題視するほどの誤差なのかはまた別の話 9

10.

（補足）平均値の検定｜片側検定の場合 3 標本から得られた検定統計量の値の起こりやすさを考える ▌片側検定 𝑁 2000, 202 正規分布 𝑋ത ∼ 𝑁 2000, 202 において標本平均が1960時間よりも短くなる確率は極端に低い 𝑃 𝑋ത ≤ 1960 極端に高い + 𝑃(𝑋ത ≥ 2040) 標準化したら極端に低い 1960 − 2000 ҧ 𝑃 𝑍≤ 20 極端に高い 2040 − 2000 ത + 𝑃 𝑋≥ 20 11 統計的仮説検定の例どうせ標準化するので初めから検定統計量を 𝑍ҧ とすることも多い 𝑍ҧ ∼ 𝑁(0,1) 10

11.

（補足）平均値の検定｜片側検定の場合 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑁 0, 1 ▌片側検定正規分布 𝑋ത ∼ 𝑁 2000, 202 において 𝜇 = 2000 の場合 25個体での標本平均が 2000時間より40時間以上短くなる確率はおよそ2.28% 𝑃 𝑍ҧ ≤ −2 𝑝 = 0.0288 （両側検定のときの半分） 4 帰無仮説を棄却するかを判断する 25個体の平均が1960時間というのは 𝜇 = 2000 だとすると結構レアなこと 𝑝 < 𝛼 のため帰無仮説が間違っていると言えそう（棄却する） 11 統計的仮説検定の例 11

12.

平均値の検定母分散がわからないバージョン 11 統計的仮説検定の例 12

13.

平均値の検定その２問【前の例の続き】よく考えたら，素材変更後も電球の寿命の個体差が同じ（標準偏差100時間）とは限りません。実際に，先程テストした25個の電球では，平均が1960時間，標準偏差120時間でした。さて，この電球の寿命は従来のものより短くなっているでしょうか？統計的に検証してください。旧平均2000時間標準偏差100時間素材の一部に空き缶を再利用 SDGs 新正規母集団では標本平均の標本分布が 𝜎2 𝑁 𝜇, 𝑛 ▼ 平均1960時間母分散がいくつなのかによって 𝑝 値は大きく変わるはず標準偏差120時間ばらつきが大きいってことはたまたまザコ個体が選ばれてたかも？ 11 統計的仮説検定の例 13

14.

平均値の検定 1 仮説を設定する ▌まずは母集団分布を仮定する母集団分布の仮定は問題設定に含まれていることもありますが特に指定がない場合には自分で考える必要があります。電球の耐久時間は正規分布に従うはず（そう仮定しても問題ないだろう） ▌どのパラメータが検証の対象かをはっきりさせておくとよい母集団分布が正規分布ならば… 新しい電球の寿命の分布 𝑁 𝜇, 𝜎 2 もちろん電球の寿命には個体差があるが，平均的には従来と同じ2000時間ならばとりあえず問題はないと言えそう 𝑁 𝜇, 𝜎 2 の 𝜇 が2000かどうかを検定する前の例との違いは 𝜎 2 がわからないということだけ 11 統計的仮説検定の例 14

15.

平均値の検定 1 仮説を設定する ▌まずは母集団分布を仮定する母集団分布の仮定は問題設定に含まれていることもありますが特に指定がない場合には自分で考える必要があります。電球の耐久時間は正規分布に従うはず（そう仮定しても問題ないだろう） ▌どのパラメータが検証の対象かをはっきりさせておくとよい母集団分布が正規分布ならば， 𝑁 𝜇, 𝜎 2 の 𝜇 に関心がある今回は両側検定にしておきます【実際に検証したいこと】平均寿命は2000時間ではない 𝜇 ≠ 2000 alternative hypothesis 現実にはどちらか一方だけが正しい対立仮説 11 統計的仮説検定の例【の逆】平均寿命は2000時間である 𝜇 = 2000 null hypothesis 帰無仮説 15

16.

平均値の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌検定統計量は推定のときと同じ考え方で母平均の検定の場合は，標本平均を用いて考えたら良い母分散が分からないので標本分散からの推定値を使う ▼ 平均寿命は2000時間である 𝜇 = 2000 null hypothesis 帰無仮説こちらが正しい場合の 25個体（標本）での標本平均の標本分布を考えたい不偏分散は 𝑛 25 𝑠𝑥2 = × 1202 = 15000 𝑛−1 24 ▼ 標本平均の標本分布は 15000 𝑋ത ∼ 𝑁 2000, ≃ 𝑁 2000, 24.492 25 となりそうだが…？ 11 統計的仮説検定の例 16

17.

平均値の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌母分散ではなく不偏分散を用いたときの標本分布は母分散が資料09 p. 54 の場合の標本平均の標本分布標本平均の標本分布を分布で表していく標本平均の標本分布を = 1 【】母分散を使って標本平均を標準化した値 2 2 × 出する場合は 1 2 ( = 1) 2 ( 1 1) 1 不偏分散を使って標本平均を標準化した値 = 2 の標本分布は 1 標準正規分布になる自 2 度 2 の標本分布は 1 の分布になる定 11 統計的仮説検定の例 17

18.

平均値の検定 2 帰無仮説が正しいときの検定統計量の分布を考える母分散がわかっているとき不偏分散で代用したとき分散の推定値のばらつきの影響が加わるため正規分布標本平均の標本分布正規分布よりも少しだけ裾が重い標準正規分布 𝑁(0,1) 標準化したら 𝑡 分布 𝑡(𝑛 − 1) 11 統計的仮説検定の例 18

19.

平均値の検定 3 標本から得られた検定統計量の値の起こりやすさを考える ▌両側検定標本平均 𝑋ത を帰無仮説の値2000，不偏分散に基づく標準誤差標準化した値 𝑡 = 𝑡 が標本での値 𝑋ത −2000 15000/25 は自由度 24 の 𝑡 分布に従う 1960−2000 15000/25 15000 によって 25 𝑡 24 ≃ −1.63 よりも極端になる確率は極端に低い 𝑃 𝑡 ≤ −1.63 極端に高い + 𝑃(𝑡 ≥ 1.63) 11 統計的仮説検定の例 19

20.

平均値の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑡 24 ▌両側検定 𝑡 分布 𝑡(24) において 𝜇 = 2000 の場合不偏分散をもとに標準化した標本平均が -1.63よりも極端になる確率は 𝑡 分布表にはありませんがとりあえず5%よりは高いちゃんと計算すると 𝑝 = 0.1161 4 帰無仮説を棄却するかを判断する 25個体の平均が1960時間というのは 𝑝 ≥ 𝛼 のため 𝜇 = 2000 だとしてもまあまああり得ること安定性下がってるけどそれはいいのかい？帰無仮説が間違っているとは言えない（棄却できない） 11 統計的仮説検定の例 20

21.

（補足）母平均の検定について ▌中心極限定理のおかげで母集団分布が何であっても標準正規分布または 𝑡 分布の検定になる ▌基本的には 𝑡 検定母分散がわかっているのはかなり限られたケースだと思っておいて良いサンプルサイズが大きければ 𝑁(0,1) と 𝑡 分布はほぼ同じになる ▌母集団分布が二項分布の場合帰無仮説は成功確率 𝑝 について設定される (𝑛 は既知) 平均値 [𝑛𝑝] と分散 𝑛𝑝 1 − 𝑝 が同時に決まるため標準正規分布の検定になる 11 統計的仮説検定の例 21

22.

（補足）標本平均に関する検定は他にも 𝑡 分布に帰着する ▌２標本の検定問血圧を下げる２つの新薬A, Bを考えます。ランダムに選ばれた50人ずつを対象にテストを行いました。その結果，新薬Aを投与された人は平均で15mmHg，新薬Bを投与された人は平均で12mmHg下がりました。この新薬AとBの効果に差はあるでしょうか？統計的に検証してください。効果の平均に差はない 𝜇𝐴 − 𝜇𝐵 = 0 (𝜇𝐴 = 𝜇𝐵 ) null hypothesis 帰無仮説 2 平均値差を（平均0）と不偏分散𝑠෢ 𝑥 に基づく標準誤差で標準化した値 𝑡= 𝑥𝐴ҧ − 𝑥ҧ𝐵 (−0) 1 2 1 𝑠෢ + 𝑥 𝑛 𝑛2 1 これが自度𝑛1 + 𝑛2 − 2の𝑡分布に従う 2 𝑠෢ 𝑥 は各グループの標本で算出した不偏分散をサンプルサイズで重みづけた平均 11 統計的仮説検定の例 22

23.

（補足）標本平均に関する検定は他にも 𝑡 分布に帰着する ▌２標本の検定その２ ID 効果A 効果B 𝑥𝐴 − 𝑥𝐵 問血圧を下げる２つの新薬A, Bを考えます。ランダムに選ばれた50人に，初日は新薬Aを，翌日には新薬Bを投与してみました。その結果，個人ごとの効果が右の表のようになりました。この新薬AとBの効果に差はあるでしょうか？統計的に検証してください。 1 8 12 -4 2 10 7 3 ︙ ︙ ︙ ︙ 49 0 5 -5 50 -3 -6 3 2 個人ごとの効果差 𝑥𝐴 − 𝑥𝐵 の母集団分布が正規分布 𝑁 𝜇𝐴−𝐵 , 𝜎𝐴−𝐵 に従うと考えると効果の平均に差はない 𝜇𝐴−𝐵 = 0 null hypothesis 帰無仮説 𝑡= 𝑥𝐴 − 𝑥𝐵 (−0) 2 𝑠෣ 𝐴−𝐵 /𝑛 これが自度𝑛 − 1の 𝑡 分布に従うつまりpp. 13-20と全く同じです 11 統計的仮説検定の例 23

24.

相関係数の検定ルーティーンだけ感じてください 11 統計的仮説検定の例 24

25.

相関係数の検定問あるスーパーでは新商品のおせんべいのDMを送るターゲットを決めることにしました。そこで，過去１年間におけるおんいのが多い属性を探ることにしました。 100人分の顧客のPOSデータからとの相関を算出したところ，0.2の相関が見られました。さて，おせんべい購入数と年齢には相関があるでしょうか？統計的に検証してください。標本んい母集団せんべいをよく買う広告を出す意味がありそう高齢者 𝑟 = 0.2 （潜在的な）すべての顧客 POSデータがある顧客100人若者 11 統計的仮説検定の例せんべいをあまり買わない広告を出しても意味なさそう 25

26.

相関係数の検定 1 仮説を設定するそもそも以前紹介した相関係数自体が正規分布を前提としたものなので，正規分布以外ではこの検定は使えないと思ってください。 ▌まずは母集団分布を仮定する２つの変数がいずれも正規分布に従っていると仮定します ▌どのパラメータが検証の対象かをはっきりさせておくとよい母集団での真の相関係数を 𝜌 (ロー) と置きます母集団年齢と（潜在的な）せんべい購入数の相関 𝜌 今回の標本母集団で相関があるか検証したい 𝜌 が0かどうかを検定する 𝑟 = 0.2 𝑟 = 0.15 𝑟 = −0.04 𝑟 = 0.01 サンプリングを繰り返したとしたら標本ごとに異なる標本相関係数が出る資料05 p. 23 の考え方標本相関係数の標本分布が得られる 11 統計的仮説検定の例 26

27.

相関係数の検定 1 仮説を設定する ▌まずは母集団分布を仮定する母集団分布の仮定は問題設定に含まれていることもありますが特に指定がない場合には自分で考える必要があります。２つの変数がいずれも正規分布に従っていると仮定します ▌どのパラメータが検証の対象かをはっきりさせておくとよい母集団分布での相関係数 𝜌 に関心がある【実際に検証したいこと】母集団の相関係数は0ではない 𝜌≠0 alternative hypothesis 対立仮説現実にはどちらか一方だけが正しい 11 統計的仮説検定の例【の逆】母集団の相関係数は0である 𝜌=0 null hypothesis 帰無仮説 27

28.

相関係数の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌検定統計量は推定のときと同じ考え方で母相関係数の検定の場合は，標本相関係数を用いて考えたら良い母集団の相関係数は0である 𝜌=0 null hypothesis 𝑡 98 帰無仮説の元での分布帰無仮説帰無分布こちらが正しい場合標本相関係数 𝑟 を変換した値 𝑡= 𝑟 1 − 𝑟2 𝑛 − 2 は自度 𝑛 − 2 の 𝑡 分布に従う実際にはソフトウェアがやってくれるので原理だけ理解しましょう 11 統計的仮説検定の例 28

29.

相関係数の検定 3 標本から得られた検定統計量の値の起こりやすさを考える ▌両側検定標本相関係数 𝑟 を変換した値 𝑡 = 𝑡 が標本での値 0.2 1−0.22 𝑟 1−𝑟 2 𝑛 − 2 は自由度 𝑛 − 2 の 𝑡 分布に従う 98 ≃ 1.99 よりも極端になる確率は極端に低い 𝑃 𝑡 ≤ −1.99 𝑡 98 極端に高い + 𝑃(𝑡 ≥ 1.99) 11 統計的仮説検定の例 29

30.

相関係数の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑡 98 ▌両側検定母相関係数が 𝜌 = 0 だとすると 𝜌 = 0 の場合 100人での標本相関係数の絶対値が 0.2以上になる確率はとりあえず5%よりは低いちゃんと計算すると 𝑝 = 0.0494 4 帰無仮説を棄却するかを判断する 100人での標本相関係数が0.2というのは 𝜌 = 0 だとすると結構レアなこと 𝑝 < 𝛼 のため帰無仮説が間違っていると言えそう（棄却する） 11 統計的仮説検定の例つまり高齢者メインで DMを送りつけたらいいんだね？ 30

31.

（超補足）母相関係数の推定 Ingram Olkin. John W. Pratt. "Unbiased Estimation of Certain Correlation Coefficients." Ann. Math. Statist. 29 (1) 201 - 211, March, 1958. https://doi.org/10.1214/aoms/1177706717 ▌点推定実用的には標本相関係数が用いられる（最尤定量のため） ※不偏定量ではないが，不偏定量は計算が相当めんどくさいのでほぼ使われない ▌ 区間推定 1 2 母相関係数が 𝜌 のとき， 𝜌∗ = log 1+𝜌 とおくと 1−𝜌 1 2 標本相関係数 𝑟 を同様に変換した 𝑟 ∗ = log 𝜌∗ の95%信頼区間は具体的には資料09 p. 46 𝜌𝐿∗ = 𝑟 ∗ − 1.96 1 𝑛−3 𝜌𝐻∗ = 𝑟 ∗ + 1.96 1 𝑛−3 フィッシャーのz変換と呼ばれるものです。「そういう変換があるんだなぁ」と頭の片隅においてください。 1+𝑟 は近似的に正規分布 𝑁 1−𝑟 𝜌∗ , 1 𝑛−3 に従うと同じように 𝑟 ∗ ± 1.96 ×（標準誤差）になる exp 2𝜌𝐿∗ − 1 exp 2𝜌𝐻∗ − 1 𝜌 に戻すと ≤𝜌≤ exp 2𝜌𝐿∗ + 1 exp 2𝜌𝐻∗ + 1 11 統計的仮説検定の例 31

https://doi.org/10.1214/aoms/1177706717

32.

クロス表の検定 11 統計的仮説検定の例 32

33.

クロス表の検定問【前の例のつづき】 DMのターゲットを決めるために，続いて性別との関連を見てみることにしました。 100人分の顧客のPOSデータから「性別」と「んいを買ったことがあるか」の２つの変数ででクロス表を作成しました。さて，おせんべい購入歴と性別には関連があるでしょうか？統計的に検証してください。母集団（潜在的な）すべての顧客標本 POSデータがある顧客100人 11 統計的仮説検定の例クロス表男女計せんべい有購入歴無 17 18 35 23 42 65 計 40 60 100 性別によって購入率に有意差があればどちらかにターゲットを絞ってもよさそう 33

34.

クロス表の検定 1 仮説を設定する ▌まずは母集団分布を仮定する厳密に言えば，「クロス表の各セルに所属する確率がそれぞれある値」という確率分布（多項分布）が仮定されます特別な仮定は不要です。 ▌どのパラメータが検証の対象かをはっきりさせておくとよい母集団での真の連関の強さを 𝜙 (ファイ) と置きます母集団今回の標本せんべい購入歴性別と（潜在的な）せんべい購入有無の連関 𝜙 せんべい購入歴男女計せんべい有購入歴無 17 18 35 23 42 65 計 40 60 100 𝜌 や 𝜇 などと違って特によく使われる表記ではない母集団で連関があるか検証したい 𝜙 が0かどうかを検定する男女計有 19 16 無 21 44 計 40 60 資料05 サンプリングを繰り返したとしたら p. 23 100 標本ごとに異なる連関の強さのクロス表が出る男女計有 15 20 35 無 25 40 65 計 40 60 100 35 65 標本での連関の強さの標本分布が得られる 11 統計的仮説検定の例の考え方 34

35.

クロス表の検定 1 仮説を設定する ▌まずは母集団分布を仮定する特別な仮定は不要です。厳密に言えば，「クロス表の各セルに所属する確率がそれぞれある値」という確率分布（多項分布）が仮定されます ▌どのパラメータが検証の対象かをはっきりさせておくとよい母集団での真の連関の強さ 𝜙 (ファイ) に関心がある【実際に検証したいこと】母集団の連関は0ではない 𝜙≠0 alternative hypothesis 対立仮説現実にはどちらか一方だけが正しい 11 統計的仮説検定の例【の逆】母集団の連関は0である 𝜙=0 null hypothesis 帰無仮説 35

36.

クロス表の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌検定統計量は推定のときと同じ考え方で母集団の連関の検定の場合は，標本での連関の強さを用いて考えたら良い母集団の連関は0である 𝜙=0 𝜒2 1 帰無仮説の元での分布 null hypothesis 帰無仮説資料03 pp. 40-43 帰無分布こちらが正しい場合標本での連関の強さを表す 𝜒 2 値は自度（行数-1）×（列数-1）の𝜒 2 分布に従う 2×2クロス表の場合の自度は1 11 統計的仮説検定の例 36

37.

（補足）クロス表の自度 ▌クロス表にあるデータの個数基本的には行数×列数だけ値が存在するせんべい有購入歴無男女 ① ② ③ ④ ２×２＝４個 ▌クロス表での「固定」周辺度数が固定されていると考える ①が決まると… ▼ 男女計２×２の場合，１個決まるとあとは自動で決まるせんべい有購入歴無 ① 36-① 36 41-① 23+① 64 計 41 59 100 サイズが増えても… 変数２変数１ A B C D A 自動 B 自動 C 自動自動自動自由度1 自由度は（行数-1）×（列数-1）自動 11 統計的仮説検定の例 37

38.

クロス表の検定 3 標本から得られた検定統計量の値の起こりやすさを考える ▌片側検定標本での連関の強さを表す 𝜒 2 値は自由度（行数-1）×（列数-1）の𝜒 2 分布に従う 𝜒 2 値が標本での値 1.648 よりも極端になる確率は 𝜒2 1 極端に高い 𝑃 𝜒 2 > 1.648 連関のように，0を起点として一方向しかないようなケースでは必ず片側検定になります 11 統計的仮説検定の例 38

39.

（補足） 𝜒 2 値の計算資料03 pp. 40-43 ▌期待度数を求める同じ周辺度数で連関が全くないとしたら男女せんべい有購入歴無計計男女計 14 21 35 65 せんべい有購入歴無 26 39 65 100 計 40 60 100 35 40 60 有×男の場合，【有の周辺度数】×【男の周辺度数】を総度数で割る (40×35)/100 ▌ズレをもとに計算する期待度数ー観測度数 2 各セルごとにを計算すると期待度数せんべい購入歴男女有 0.643 0.429 無 0.346 0.230 総和を取れば𝜒 11 統計的仮説検定の例 2 = 1.648 39

40.

クロス表の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝜒2 1 ▌検定母集団での連関が 𝜙 = 0 だとすると 𝜙 = 0 の場合 100人の標本で𝜒 2 が 1.648以上になる確率はとりあえず5%よりは高いちゃんと計算すると 𝑝 = 0.1992 4 帰無仮説を棄却するかを判断する 100人の標本で今回くらいの連関は 𝜙 = 0 だとしても割とあり得ること 𝑝 ≥ 𝛼 のため性別はあまり関係ないかぁ帰無仮説が間違っているとは言いきれない（棄却できない） 11 統計的仮説検定の例 40

41.

検定統計量とサンプルサイズ資料10 pp. 26-28 ▌すべての検定統計量に共通の性質効果の大きさととの積になっているサンプルサイズ 𝑋ത − 𝜇0 例｜標本平均の検定統計量は 𝑍ҧ = 𝜎2 𝑛 𝑋ത − 𝜇0 = × 𝜎 𝑛 ▌ということは，統計的仮説検定は効果の大きさが大きいほど有意になりやすいサンプルサイズが大きいほど有意になりやすい本質的には帰無仮説は必ず棄却されるのでサンプルサイズが無限なら必ず有意になる ▌有意なら良いのか？サンプルサイズが極端に大きい場合，効果の大きさがほぼゼロでも有意になる検定の結果だけでなく，実質的な大きさも確認しておくし 11 統計的仮説検定の例 41

42.

区間推定と統計的仮説検定の関係実はほぼ同じなのです 11 統計的仮説検定の例 42

43.

信頼区間と棄却域 ▌母分散既の母平均の検定における棄却域 pp. 4-9 標準化を戻す ത 𝑋−2000 1002 /25 < −1.96 または ത 𝑋−2000 1002 /25 > 1.96 標本平均が 𝑋ത < 1960.8 または 𝑋ത > 2039.2 ならば帰無仮説は棄却される 11 統計的仮説検定の例 43

44.

信頼区間と棄却域標準化を ▌棄却されるギリギリの場合を考える戻す 2000 200 0 100 /25 100 /25 < 1.96 または > 1.96 12 標本平均がちょうど1960.8のとき 2 母平均が1960.8だとしたら標本分布は 1002 𝑁 1960.8, 25 標本平均が 2 標本平均がちょうど2039.2のとき < 母平均が2039.2だとしたら標本分布は 1960.8 または > 2039.2 ならば帰無仮説は棄却される 1002 𝑁 2039.2, 25 統計的仮説検定の例 95%信頼区間は 1921.6から 2000 95%信頼区間は 2000 から2078.4 95%信頼区間の端が帰無仮説の値 (𝜇 =2000) になっている 11 統計的仮説検定の例 44

45.

つまりどういうことか標本平均棄却域 𝜇 = 2000 1960 1960.8 標本平均がこの間にあれば 95%区間は帰無仮説の値 𝜇 = 2000 を含む pp. 4-9の例ではこの区間 1920.8 2000 1921.6 1980 2000 1940.8 2019.2 1960.8 2039.2 2020 1980.8 2039.2 棄却域標本平均の値が変わると 95%区間はどう変化するか 1999.2 2059.2 2000 2078.4 2040 2000.8 11 統計的仮説検定の例 2079.2 45

46.

つまりどういうことか ▌統計的仮説検定と区間推定は表裏一体の関係にあるにおける棄却域有意水準を 𝛼 とすると（普通は 𝛼 = 5%）両側検定の場合に限りますつまりどういうことかの例ではこの区間 = 2000 標本平均の値が変わると区間はどう変化するか = 2000 標準化を戻す > 1.96 統計的仮説検定の例標本平均が得られた標本統計量から作った検定統計量が棄却域に含まれる < 1960.8 または母数の 100 − 𝛼 %信頼区間が > 2039.2 帰無仮説が棄却される帰無仮説の値を含まないならば帰無仮説は棄却される統計的仮説検定の例実践では，検定結果と信頼区間を両方とも報告しておくのが良いとされています 11 統計的仮説検定の例 46