65.3K Views
February 18, 23
スライド概要
2022年度統計学Iの講義資料です。
好きな色は緑です。
統計学 I-2 ・統計学の導入 ・記述統計 ・確率論 https://logics-of-blue.com/
本資料について 本資料の成り立ち 馬場が担当する学部1年生向け統計学Iの講義資料抜粋 統計学を初めて学ぶ、文系の学生が受講する想定 本資料の取り扱い あくまでも、本来の講義資料の抜粋なので注意 (計算演習・講義内クイズ・前回講義の復習 口頭での説明内容等は省略) SNSなどでスライドのスクショを張り付けるのは、 避けてほしい (文脈がわからないと、誤った理解を促すため) 2
本資料について 本資料の使い方 想定①:講義の受講者が復習に利用する 想定②:未受講者が統計学入門資料として利用する ※想定②の場合は、下記参考文献も参照すること 参考文献 馬場真哉,2022,翔泳社 『Pythonで学ぶあたらしい統計学の教科書 第2版』 倉田博史・星野崇宏,2009,新世社 『入門統計解析』 鈴木武・山田作太郎,1996,内田老鶴圃 『数理統計学』 3
本資料の範囲 8.確率論の基礎1 9.確率論の基礎2 10.確率分布の基礎1 11.確率分布の基礎2 12.代表的な確率分布 13.多次元確率分布の基礎 14.独立同一分布に従う確率変数 15.期末テスト
統計学 I 第8回:確率論の基礎
内容 1.中間テストについて 2.確率論はなぜ必要か 3.集合の記号の読み方の復習 4.確率論の基礎 6
中間テストについて 7
確率論はなぜ必要か 8
確率論について データを分析するのに、なぜ確率が必要か? 統計学の教科書では、思い出したように(?) 確率論がいきなり現れます。 →前期の後半(中間テスト以降)は確率論です 確率論が、なぜ、どのようにして使われるのか、 データを分析するのに、なぜ確率を学ぶ必要があるのか、 推測統計の基本的な考え方と合わせて説明します。
データに基づく判断・意思決定のために 【記述統計】手持ちのデータの集計 【推測統計】未知のデータに対する判断・推測 推測統計を理解するためには、確率の知識が必要 ・・・・・・なぜ?
内容 1.ガチャの事例 2.湖調査の事例
内容 1.ガチャの事例 2.湖調査の事例
確率論を学ぶ意義 ダメそうな推論の仕方 スマホゲームで10連ガチャを回しても、当たりが出ない ↓ このガチャは、当たりが一人も入ってない。不正だ!! 根拠のないクレームでは?
確率論を学ぶ意義 ダメそうな推論の流れ Step1.データ取得:10連ガチャを回す 結果:当たりキャラが出ない ↓ Step2.未知のデータに対する推測 このガチャでは、当たりキャラ出現率が0%である! ↓ Step3.予測 誰が回しても、ガチャで当たりなんか出ないよ!!! この推測・予測は明らかに間違い 確率的に、当たったり外れたりするはず
内容 1.ガチャの事例 2.湖調査の事例
推測統計の使い道 すべての魚(およそ1億尾) 湖にいる魚の体長を調べたい しかし全ての魚の体長を調べるのは無理 16
推測統計の使い道 500尾くらいなら、 体長を調べられそう 17
推測統計のテーマ 湖の中のすべての魚の体長 母集団 すべてのデータ 未知のデータを含む 標本 母集団の一部 手に入ったデータ 釣りをして得られた魚の体長 標本を使って、母集団について議論する 手持ちのデータで未知データの議論をする
確率はどこで登場するか たまたま 「中くらいのサイズ」 の魚が釣れた 19
確率はどこで登場するか たまたま 「小さめのサイズ」 の魚が釣れた 20
確率はどこで登場するか たまたま 「大きめのサイズ」 の魚が釣れた 21
確率はどこで登場するか ランダムに一部の魚を標本として抽出 ここで確率が登場する 22
確率はどこで登場するか 同じ母集団から標本を抽出しても、毎回違う結果になる 平均3cm 平均7cm 確率的に結果が変わる! 確率的に、標本の体長の平均値が 大きくなったり小さくなったりする
確率論を学ぶ意義 確率論を学ぶ理由① 後期で学ぶ推測統計の基礎となるから →推測統計を理解するためには、確率論の理解が必須 確率論を学ぶ理由② 確率論そのものも、ビジネスで活用できる →誤った解釈をしないように 確率論を扱ったビジネス書も多く出版されている (基本的には、講義指定の教科書が1冊あれば十分)
推測統計と確率論の関わり 推測統計では確率論の理解が必要 標本(データ)は、確率的に得られるから 推測統計学の用語(詳しくは後期で解説) 母集団 未知データを含む、対象全体 標本 母集団の一部。手に入るデータはこれだけ
まとめ 統計学とは データを収集、表示、解析する科学 以下の2つに分けられる 記述統計 なるべく情報量を減らさないで 比較・解釈を簡単にする集計方法を探る 推測統計 全体の一部である標本だけを使って、 まだ手に入れていない未知データの推測・予測をする (確率論の理解が必須)
集合の記号の読み方の復習 27
集合の記号 なぜ集合を学ぶのか 集合論は、数学におけるアルファベットのABC アルファベットが読めないで、英語の長文読解は不可能 記号は後で復習 資料を見れば意味が分かるようにしておく 28
内容 1.集合の記号の初歩 2.複数の集合の関係を表す記号 3.集合に関するその他の記号
内容 1.集合の記号の初歩 2.複数の集合の関係を表す記号 3.集合に関するその他の記号
集合の記号 集合の基本 集合とは「客観的に範囲が決められたモノの集まり」のこと 個別のモノは集合の要素と呼ばれる 例) 集合 個別の要素 𝐴 𝑎 31
集合の記号 集合の基本 「客観的に範囲が決められたモノの集まり」が大事 これはOK 「0以上4以下の整数の集合」 𝐴 = 0,1,2,3,4 個別の要素 𝑎1 = 0, 𝑎2 = 1, 𝑎3 = 2, 𝑎4 = 3, 𝑎5 = 4 これはダメ 「小さな数値の集合」 →「小さな」って具体的にどんな値? 32
集合の記号 集合と要素 ある要素𝑎が、ある集合𝐴に属することを𝑎 ∈ 𝐴と表記する 属していない場合は𝑎 ∉ 𝐴と表記する 例) 0以上4以下の整数の集合 𝐴 = 0,1,2,3,4 個別の要素 𝑎1 = 0, 𝑎2 = 1, 𝑎3 = 2, 𝑎4 = 3, 𝑎5 = 4 このとき 𝑎1 ∈ 𝐴 (もちろん、𝑎2 ∈ 𝐴であるし、𝑎5 ∈ 𝐴である) 33
集合の記号 集合の記法① 外延的記法 𝐴 = 0,1,2,3,4 のように、要素を中カッコの中に並べる →シンプルだけど、要素が増えると大変…… →0から100までの整数がすべて要素だったらどうする? 集合の記法② 内包的記法 𝐴 = 𝑎; 𝑎は整数、かつ、0 ≤ 𝑎 ≤ 4 のように、条件を書く →一見するとややこしいけど、要素が増えても大丈夫 →0から100までの整数がすべて要素だったらどうする? 𝐴 = 𝑎; 𝑎は整数、かつ、0 ≤ 𝑎 ≤ 100 条件はセミコロン「 ; 」や縦棒「 |」の 右側に書く。内包的記法にも慣れておこう 34
内容 1.集合の記号の初歩 2.複数の集合の関係を表す記号 3.集合に関するその他の記号
集合の記号 部分集合 2つの集合𝐴, 𝐵において「 𝑎 ∈ 𝐴 ならば𝑎 ∈ 𝐵 」である時 𝐴を𝐵の部分集合と呼び、 𝐴 ⊂ 𝐵と表記する 例) 𝐴 = 0,1,2,3,4,5 𝐵 = 0,1,2,3,4,5,6,7 このとき、 𝐴 ⊂ 𝐵 𝐵の方が、なんとなく𝐴より大きそうな気がする 36
集合の記号 ベン図 複数の集合を比較するときに便利な図 部分集合などが一目でわかる 𝐴 = 0,1,2,3,4,5 𝐵 = 0,1,2,3,4,5,6,7 集合B 6,7 集合A 0,1,2 3,4,5 37
集合の記号 積集合 2つの集合𝐴, 𝐵において、以下を積集合と呼ぶ 𝐴 ∩ 𝐵 = 𝑎; 𝑎 ∈ 𝐴 かつ𝑎 ∈ 𝐵 和集合 2つの集合𝐴, 𝐵において、以下を和集合と呼ぶ 𝐴 ∪ 𝐵 = 𝑎; 𝑎 ∈ 𝐴 または𝑎 ∈ 𝐵 積集合 𝐴 ∩ 𝐵 集合A 集合B 和集合 𝐴 ∪ 𝐵 集合A 集合B 38
集合の記号 差集合 2つの集合𝐴, 𝐵において、以下を差集合と呼ぶ 𝐴 − 𝐵 = 𝑎; 𝑎 ∈ 𝐴 かつ𝑎 ∉ 𝐵 差集合 集合A 𝐴−𝐵 集合B 39
内容 1.集合の記号の初歩 2.複数の集合の関係を表す記号 3.集合に関するその他の記号
集合の記号 空集合 要素を1つも含まない集合。∅と表記する ちなみに∅ ∪ ∅ = ∅ 全体集合 「ある集合(例えば𝑆)の部分集合しか扱わない」 と定めた時、集合𝑆を全体集合と呼ぶ (全体集合の記号は𝑆でも𝐾でも、 見分けがつけば何でも良い) 41
集合の記号 補集合 全体集合を𝑆とする 𝑆の部分集合𝐴に対して、以下を補集合と呼ぶ 𝐴𝑐 = 𝑆 − 𝐴 全体集合S 集合A 補集合 𝐴c 42
確率論の基礎 43
内容 1.標本空間と事象 2.確率の公理主義的定義 3.確率の取り扱いの基本 44
内容 1.標本空間と事象 2.確率の公理主義的定義 3.確率の取り扱いの基本 45
確率論の基礎 試行 調査や実験、観測のこと 例)アンケート調査・薬の効能の実験 イカサマコインかどうかを判定するためのコイン投げ 標本空間 試行の結果として、 起こり得る可能な結果の全体を要素とする集合 記号Ω(オメガ)を使うことが多い 個別の要素は標本点と呼ぶ 事象 標本空間の部分集合 要素が1つしかない場合を根源事象と呼ぶ 46
確率論の基礎 コイン投げの例 コインを1回投げて、表か裏かを観測するという試行 ただし、表を1、裏を0と表記する 標本空間 Ω = 0,1 事象 (標本空間の部分集合) 表が出るという事象𝐴 = 1 根源事象 裏が出るという事象𝐵 = 0 根源事象 47
確率論の基礎 サイコロ投げの例 サイコロを1回投げて、出た目を観測するという試行 標本空間 Ω = 1,2,3,4,5,6 事象 (標本空間の部分集合) 1の目が出るという事象𝐴 = 1 2の目が出るという事象𝐵 = 2 偶数が出るという事象𝐶 = 2,4,6 奇数が出るという事象𝐷 = 1,3,5 5以上の目が出るという事象𝐸 = 5,6 などなど…… 根源事象 根源事象 根源事象ではない 根源事象ではない 根源事象ではない 48
確率論の基礎 確率論と集合 標本空間も事象も集合なので、集合の記法が使える 余事象(補集合みたいなもの) 事象𝐴の余事象は𝐴𝑐 = Ω − 𝐴 積事象と和事象 (積集合と和集合みたいなもの) 事象𝐴, 𝐵において 積事象𝐴 ∩ 𝐵 = 𝑎; 𝑎 ∈ 𝐴 かつ𝑎 ∈ 𝐵 和事象𝐴 ∪ 𝐵 = 𝑎; 𝑎 ∈ 𝐴 または𝑎 ∈ 𝐵 49
確率論の基礎 排反事象(とても重要) 事象𝐴, 𝐵において、「重なり」が無いとき すなわち積事象𝐴 ∩ 𝐵 = ∅であるとき、 𝐴, 𝐵は互いに排反であると呼ぶ 標本空間Ω 事象A 事象B 50
確率論の基礎 サイコロ投げの例 サイコロを1回投げて、出た目を観測するという試行 標本空間 Ω = 1,2,3,4,5,6 事象 (標本空間の部分集合) 1の目が出るという事象𝐴 = 1 2の目が出るという事象𝐵 = 2 事象𝐴, 𝐵は排反 偶数が出るという事象𝐶 = 2,4,6 奇数が出るという事象𝐷 = 1,3,5 事象𝐶, 𝐷は排反 なお、事象𝐴, 𝐷は排反ではない(1の目は事象𝐷にもある) 51
内容 1.標本空間と事象 2.確率の公理主義的定義 3.確率の取り扱いの基本 公理とは約束事くらいの意味 「ある約束事」を満たすものを確率と呼ぶ 52
確率論の基礎 確率の公理主義的定義 標本空間Ωの任意の事象𝐴に対して、 実数 𝑃 𝐴 が定まっていて 以下の3つの公理を満たす𝑃 𝐴 を事象𝐴の確率と呼ぶ 公理1: 任意の事象𝐴に対して0 ≤ 𝑃 𝐴 ≤ 1 公理2: 標本空間Ωに対して𝑃 Ω = 1 公理3: 互いに排反な事象𝐴1 , 𝐴2 ,…に対して、 𝑃 𝐴1 ∪𝐴2 ∪… = 𝑃 𝐴1 + 𝑃 𝐴2 + ⋯ 53
確率論の基礎 確率の公理主義的定義 公理の意味 公理1: 任意の事象𝐴に対して0 ≤ 𝑃 𝐴 ≤ 1 意味:確率は0以上、1以下ですよ 例:確率1.2で発生する→「1.2」は確率じゃないよ 「俺が単位を取る確率は、120%だ!」はダメ 例:確率−0.4で発生する→「−0.4 」は確率じゃないよ 「来週小テストが行われる確率は、 −40%だ!」はダメ 54
確率論の基礎 確率の公理主義的定義 公理の意味 公理2: 標本空間Ωに対して𝑃 Ω = 1 意味:「起こり得る何か」が起こる確率は、1ですよ 例:単位が取れているか、いないか、それが問題だ Ω = 単位が取れた, 単位を落とした 𝑃 単位が取れた = 0.7 𝑃 単位を落とした = 0.2 →残りの0.1はどこへ行った? 55
確率論の基礎 確率の公理主義的定義 公理の意味 公理3: 互いに排反な事象𝐴1 , 𝐴2 ,…に対して、 𝑃 𝐴1 ∪𝐴2 ∪… = 𝑃 𝐴1 + 𝑃 𝐴2 + ⋯ 意味:「重なりが無い事象のどれかが起こる確率」は 「個別の事象が起こる確率の合計」ですよ 例:成績がAランク、または、Sランクを取る確率は、 「Aランクを取る確率」+「Sランクを取る確率」 言ってること自体は、とても当たり前 56
確率論の基礎 なんで公理3をわざわざ置くのか 例えば空事象∅に対して𝑃 ∅ はいくらになるだろう? なんとなく(中身が空だから) 直感的に𝑃 ∅ = 0になる気がするし、 実際のところ𝑃 ∅ = 0になる これは公理1,3から導ける! なんで公理1,3から導けるの? 57
確率論の基礎 空事象が起こる確率が0になる理由 まずは確率の公理3より (空事象同士は∅ ∩ ∅ = ∅なので、互いに排反)、 𝑃 ∅∪∅ =𝑃 ∅ +𝑃 ∅ ここで、空事象の定義より∅ ∪ ∅ = ∅ ということで 𝑃 ∅∪∅ =𝑃 ∅ すなわち 𝑃 ∅ =𝑃 ∅ +𝑃 ∅ 58
確率論の基礎 空事象が起こる確率が0になる理由 よって以下が成り立つ 𝑃 ∅ =𝑃 ∅ +𝑃 ∅ +𝑃 ∅ … 𝑃 ∅ は何回足してても𝑃 ∅ のまま! 公理1より 0≤𝑃 ∅ ≤1 これを満たす𝑃 ∅ は𝑃 ∅ = 0しかない 公理3があると、いろんな性質が導ける 59
確率論の基礎 高校生までの確率と何が変わったか 高校生までで学んだ確率 ある事象の場合の数 確率 = 全事象の場合の数 例)コインを1回投げて表が出る確率 1 確率 = 2 この定義の何が悪いんや? 60
確率論の基礎 高校生までの確率と何が変わったか 高校生までで学んだ確率 ある事象の場合の数 確率 = 全事象の場合の数 明日、帝京大学に隕石が落ちて校舎が木端微塵になる確率 Ω = 大学は無事, 大学は破壊されました ある事象の場合の数 1 確率 = = 2 全事象の場合の数 帝京大学が隕石でつぶれる確率は2分の1? 61
確率論の基礎 「場合の数」が扱いにくい場合の対応 数直線[0,1]の範囲に針を落とす (0から1の範囲内ではどこにでも刺さり、 どの地点にでも、刺さりやすさは同様に確からしい) (針の先端は、大きさが0である点とみなされる) 針が落ちた場所が0.5以下の場所である確率は? ある事象の場合の数 ∞ 確率 = = =? ∞ 全事象の場合の数 講義ではやらないが、その気になれば、 確率についていろんな問いを検討できる 62
内容 1.標本空間と事象 2.確率の公理主義的定義 3.確率の取り扱いの基本 63
確率論の基礎 確率の加法定理 (乗法定理は来週) 互いに排反な事象A, 𝐵に対して、 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 単なる公理3の言い直し。でも大事 64
確率論の基礎 確率の加法定理の例 間違いの例) 俺はどうせS評価なんてもらえないよ!! だから「S評価、またはA評価」がもらえる確率よりも 「A評価」がもらえる確率の方が高いと考えるのは誤り 𝑃 𝑆∪𝐴 =𝑃 𝑆 +𝑃 𝐴 また、確率は必ず0以上なので 𝑃 𝑆∪𝐴 ≥𝑃 𝐴 「どちらかが起こる確率」は 片方起こる確率より高い 65
確率論の基礎 「または」の確率の計算 互いに排反とは限らない事象A, 𝐵に対して、 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵 和事象 事象A 𝐴∪𝐵 事象B 66 66
確率論の基礎 「または」の確率の計算 互いに排反とは限らない事象A, 𝐵に対して、 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵 和事象 事象A 𝐴∪𝐵 事象B 𝐴 ∩ 𝐵を ダブルカウントしてる 67 67
確率論の基礎 「または」の確率の計算 互いに排反とは限らない事象A, 𝐵に対して、 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵 和事象 事象A 𝐴∪𝐵 事象B 事象A 事象B 積事象 𝐴∩𝐵 68
クイズ 確率の加法定理 サイコロを1回投げて出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数が出るという事象𝐴 = 2,4,6 𝑃 𝐴 = 1Τ2 5以上の目が出るという 事象𝐵 = 5,6 𝑃 𝐵 = 1Τ3 偶数、かつ、5以上の目である事象𝐴 ∩ 𝐵 = 6 𝑃 𝐴 ∩ 𝐵 = 1Τ6 この時「偶数、または、5以上の目」が出る確率、 すなわち𝑃 𝐴 ∪ 𝐵 はいくらになる? 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
クイズ(回答) 確率の加法定理 サイコロを1回投げて出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数が出るという事象𝐴 = 2,4,6 𝑃 𝐴 = 1Τ2 5以上の目が出るという 事象𝐵 = 5,6 𝑃 𝐵 = 1Τ3 偶数、かつ、5以上の目である事象𝐴 ∩ 𝐵 = 6 𝑃 𝐴 ∩ 𝐵 = 1Τ6 この時「偶数、または、5以上の目」が出る確率、 すなわち𝑃 𝐴 ∪ 𝐵 はいくらになる? 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
クイズ(回答) 考え方① 𝑃 𝐴∪𝐵 加法定理の応用 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵 1 1 1 = + − 2 3 6 3+2−1 = 6 4 = 6 2 = 3 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
クイズ(回答) 考え方② 𝐴 ∪ 𝐵 を求める 「偶数、または、5以上の目」が出る事象は 𝐴 ∪ 𝐵 = 2,4,5,6 よって、 ある事象の場合の数 4 2 確率 = = = 6 3 全事象の場合の数 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
統計学 I 第9回:確率論の基礎2
内容 1.先週の復習 2.条件付き確率 3.確率の乗法定理と独立 4.ベイズの定理 74
先週の復習 75
条件付き確率 76
条件付き確率 同時確率 積事象𝐴 ∩ 𝐵が起こる確率、すなわち𝑃 𝐴 ∩ 𝐵 のこと →今までは「𝐴かつ𝐵」が起こる確率と呼んでいたが、 呼びにくいので「𝐴と𝐵が同時に」起こる確率と呼ぶ 呼びやすくするため、名前を付けただけ 77
クイズ 同時確率 サイコロを1回投げて出た目を観測するという試行を行った Ω = 1,2,3,4,5,6 偶数が出るという事象𝐴 = 2,4,6 5以上の目が出るという 事象𝐵 = 5,6 この時偶数、かつ、5以上の目である事象𝐴 ∩ 𝐵が起こる確率 言い換えると「𝐴と 𝐵が同時に起こる確率」 すなわち𝑃 𝐴 ∩ 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
クイズ(回答) 同時確率 サイコロを1回投げて出た目を観測するという試行を行った Ω = 1,2,3,4,5,6 偶数が出るという事象𝐴 = 2,4,6 5以上の目が出るという 事象𝐵 = 5,6 この時偶数、かつ、5以上の目である事象𝐴 ∩ 𝐵が起こる確率 言い換えると「𝐴と 𝐵が同時に起こる確率」 すなわち𝑃 𝐴 ∩ 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
条件付き確率 条件付き確率 事象𝐴, 𝐵に対して、以下で計算される𝑃 𝐴 𝐵 を 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」と呼ぶ 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 80
条件付き確率 条件付き確率のイメージ 確率と言えば「全体が1」 →𝑃 Ω = 1 ここで𝑃 𝐵 の確率で起こる事象𝐵が 「実際に起こった」時だけを考慮する →事象𝐵が「実際に起こった」という状況を 「全体が1」と考える。これが条件付き確率のイメージ 事象A, 𝐵に対して、以下で計算される𝑃 𝐴 𝐵 を 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」と呼ぶ 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 81
条件付き確率 条件付き確率の例 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 6の目が出るという事象𝐴 = 6 5以上の目が出るという 事象𝐵 = 5,6 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 82
条件付き確率 6の目が出るという事象𝐴 = 6 5以上の目が出るという 事象𝐵 = 5,6 条件付き確率の例 本来サイコロは6面ある 5以上の目が出た時だけを考える [5以上]という条件で6の目が出る確率は1/2 83
条件付き確率 条件付き確率の計算の流れ Step1:個別の事象の確率𝑃 𝐴 と𝑃 𝐵 を計算する Step2:同時確率𝑃 𝐴 ∩ 𝐵 を計算する Step3:以下の計算式で条件付き確率𝑃 𝐴 𝐵 を計算する 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 84
条件付き確率 6の目が出るという事象𝐴 = 6 5以上の目が出るという 事象𝐵 = 5,6 条件付き確率の計算の流れ Step1:個別の事象の確率𝑃 𝐴 と𝑃 𝐵 を計算する 𝑃 𝐴 = 1ൗ6 , 𝑃 𝐵 = 2ൗ6 85
条件付き確率 6の目が出るという事象𝐴 = 6 5以上の目が出るという 事象𝐵 = 5,6 条件付き確率の計算の流れ Step1:個別の事象の確率𝑃 𝐴 と𝑃 𝐵 を計算する 𝑃 𝐴 = 1ൗ6 , 𝑃 𝐵 = 2ൗ6 Step2:同時確率𝑃 𝐴 ∩ 𝐵 を計算する 𝐴 ∩ 𝐵 = 6 なので 𝑃 𝐴 ∩ 𝐵 = 1ൗ6 86
条件付き確率 6の目が出るという事象𝐴 = 6 5以上の目が出るという 事象𝐵 = 5,6 条件付き確率の計算の流れ Step1:個別の事象の確率𝑃 𝐴 と𝑃 𝐵 を計算する 𝑃 𝐴 = 1ൗ6 , 𝑃 𝐵 = 2ൗ6 Step2:同時確率𝑃 𝐴 ∩ 𝐵 を計算する 𝐴 ∩ 𝐵 = 6 なので 𝑃 𝐴 ∩ 𝐵 = 1ൗ6 Step3:以下の計算式で条件付き確率𝑃 𝐴 𝐵 を計算する 1ൗ 𝑃 𝐴∩𝐵 1 6 𝑃 𝐴𝐵 = = = 2 𝑃 𝐵 ൗ6 2 87
条件付き確率 6の目が出るという事象𝐴 = 6 5以上の目が出るという 事象𝐵 = 5,6 条件付き確率のイメージ 本来サイコロは6面ある 5以上の目が出た時だけを考える 条件付き確率の計算式 2分の1の確率で 「6の目」が出る 以下の計算式で条件付き確率𝑃 𝐴 𝐵 を計算する 1ൗ 𝑃 𝐴∩𝐵 1 6 𝑃 𝐴𝐵 = = = 2 𝑃 𝐵 ൗ6 2 88
クイズ 条件付き確率 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 5の目が出るという事象𝐴 = 5 5以上の目が出るという 事象𝐵 = 5,6 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
クイズ(回答) 条件付き確率 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 5の目が出るという事象𝐴 = 5 5以上の目が出るという 事象𝐵 = 5,6 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
クイズ(回答) 5の目が出るという事象𝐴 = 5 5以上の目が出るという 事象𝐵 = 5,6 条件付き確率のイメージ 本来サイコロは6面ある 5以上の目が出た時だけを考える 条件付き確率の計算式 2分の1の確率で 「5の目」が出る 以下の計算式で条件付き確率𝑃 𝐴 𝐵 を計算する 1ൗ 𝑃 𝐴∩𝐵 1 6 𝑃 𝐴𝐵 = = = 2 𝑃 𝐵 ൗ6 2 91
クイズ 条件付き確率 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 3の目が出るという事象𝐴 = 3 3以上の目が出るという 事象𝐵 = 3,4,5,6 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟒 𝟏 ④ 𝟔
クイズ 条件付き確率 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 3の目が出るという事象𝐴 = 3 3以上の目が出るという 事象𝐵 = 3,4,5,6 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟒 𝟏 ④ 𝟔
今までは事象𝐴を根源事象(要素が1つしかない)を想定 次は、根源事象ではない事象𝐴を対象にする 少し複雑にはなるが、考え方は全く同じ
条件付き確率 条件付き確率の例 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 4以上の目が出るという 事象𝐵 = 4,5,6 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 95
条件付き確率 偶数の目が出るという事象𝐴 = 2,4,6 4以上の目が出るという 事象𝐵 = 4,5,6 条件付き確率の例 本来サイコロは6面ある 4以上の目が出た時だけを考える [4以上]という条件で偶数が出る確率は2/3 96
条件付き確率 条件付き確率の計算の流れ Step1:個別の事象の確率𝑃 𝐴 と𝑃 𝐵 を計算する Step2:同時確率𝑃 𝐴 ∩ 𝐵 を計算する Step3:以下の計算式で条件付き確率𝑃 𝐴 𝐵 を計算する 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 97
条件付き確率 偶数の目が出るという事象𝐴 = 2,4,6 4以上の目が出るという 事象𝐵 = 4,5,6 条件付き確率の計算の流れ Step1:個別の事象の確率𝑃 𝐴 と𝑃 𝐵 を計算する 𝑃 𝐴 = 1ൗ2 , 𝑃 𝐵 = 1ൗ2 98
条件付き確率 偶数の目が出るという事象𝐴 = 2,4,6 4以上の目が出るという 事象𝐵 = 4,5,6 条件付き確率の計算の流れ Step1:個別の事象の確率𝑃 𝐴 と𝑃 𝐵 を計算する 𝑃 𝐴 = 1ൗ2 , 𝑃 𝐵 = 1ൗ2 Step2:同時確率𝑃 𝐴 ∩ 𝐵 を計算する 𝐴 ∩ 𝐵 = 4,6 なので 𝑃 𝐴 ∩ 𝐵 = 2ൗ6 = 1ൗ3 99
条件付き確率 偶数の目が出るという事象𝐴 = 2,4,6 4以上の目が出るという 事象𝐵 = 4,5,6 条件付き確率の計算の流れ Step1:個別の事象の確率𝑃 𝐴 と𝑃 𝐵 を計算する 𝑃 𝐴 = 1ൗ2 , 𝑃 𝐵 = 1ൗ2 Step2:同時確率𝑃 𝐴 ∩ 𝐵 を計算する 𝐴 ∩ 𝐵 = 4,6 なので 𝑃 𝐴 ∩ 𝐵 = 2ൗ6 = 1ൗ3 Step3:以下の計算式で条件付き確率𝑃 𝐴 𝐵 を計算する 1ൗ 𝑃 𝐴∩𝐵 2 3 𝑃 𝐴𝐵 = = = 1 𝑃 𝐵 ൗ2 3 100
条件付き確率 偶数の目が出るという事象𝐴 = 2,4,6 4以上の目が出るという 事象𝐵 = 4,5,6 条件付き確率のイメージ 本来サイコロは6面ある 4以上の目が出た時だけを考える 条件付き確率の計算式 3分の2の確率で 「偶数の目」が出る 以下の計算式で条件付き確率𝑃 𝐴 𝐵 を計算する 1ൗ 𝑃 𝐴∩𝐵 2 3 𝑃 𝐴𝐵 = = = 1 𝑃 𝐵 ൗ2 3 101
クイズ 条件付き確率 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 3以下の目が出るという 事象𝐵 = 1,2,3 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟒 𝟏 ④ 𝟔
クイズ(回答) 条件付き確率 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 3以下の目が出るという 事象𝐵 = 1,2,3 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟒 𝟏 ④ 𝟔
偶数の目が出るという事象𝐴 = 2,4,6 クイズ(回答)3以下の目が出るという 事象𝐵 = 1,2,3 条件付き確率のイメージ 本来サイコロは6面ある 3以下の目が出た時だけを考える 条件付き確率の計算式 3分の1の確率で 「偶数の目」が出る 以下の計算式で条件付き確率𝑃 𝐴 𝐵 を計算する 1ൗ 𝑃 𝐴∩𝐵 1 6 𝑃 𝐴𝐵 = = = 1 𝑃 𝐵 ൗ2 3 104
クイズ 条件付き確率 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 4以下の目が出るという 事象𝐵 = 1,2,3,4 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟒 𝟏 ④ 𝟔
クイズ(回答) 条件付き確率 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 4以下の目が出るという 事象𝐵 = 1,2,3,4 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟒 𝟏 ④ 𝟔
条件付き確率 条件付き確率と、普通の確率の関係 条件が付くと、確率が増えることも減ることも、 そして変わらないこともある 偶数の目が出るという事象𝐴 = 2,4,6 𝑃 𝐴 = 1ൗ2 増えた 4以上の目が出るという 事象𝐵 = 4,5,6 𝑃 𝐴 𝐵 = 2ൗ3 減った 3以下の目が出るという 事象𝐶 = 1,2,3 𝑃 𝐴 𝐶 = 1ൗ3 不変 4以下の目が出るという 事象𝐷 = 1,2,3,4 𝑃 𝐴 𝐷 = 1ൗ2
確率の乗法定理と独立 108
内容 1.確率の乗法定理 2.独立 109
内容 1.確率の乗法定理 2.独立 110
確率の乗法定理 確率の乗法定理 (乗法公式とも呼ぶ) 事象𝐴, 𝐵に対して、 𝑃 𝐴∩𝐵 =𝑃 𝐴 𝐵 ∙𝑃 𝐵 =𝑃 𝐵 𝐴 ∙𝑃 𝐴 (参考)条件付き確率 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 条件付き確率の言い直し。でも大事 111
確率の乗法定理 確率の乗法定理の例 あるスポーツの試合を対象にする 事象𝐴 = 大会が中止になる 事象𝐵 = 雨である 「雨であるという条件ならば、80%の確率で中止になる」 𝑃 𝐴 𝐵 = 0.8 天気が雨になる確率は40%である 𝑃 𝐵 = 0.4 天気が雨であって、かつ、大会が中止になる確率 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝐵 ∙ 𝑃 𝐵 = 0.8 × 0.4 = 0.32
内容 1.確率の乗法定理 2.独立 113
確率の乗法定理 事象の独立性 下記が成立するとき、事象𝐴, 𝐵が独立であると呼ぶ 𝑃 𝐴∩𝐵 =𝑃 𝐴 ∙𝑃 𝐵 (参考)確率の乗法定理で理解すると覚えやすい 𝑃 𝐴∩𝐵 =𝑃 𝐴 𝐵 ∙𝑃 𝐵 𝑃 𝐴 𝐵 = 𝑃 𝐴 のとき、事象𝐴, 𝐵は独立 114
確率の乗法定理 事象の独立性の補足 確率の乗法定理で理解すると簡単だが、 少し問題もあるので注意 (参考)確率の乗法定理 𝑃 𝐴∩𝐵 =𝑃 𝐴 𝐵 ∙𝑃 𝐵 (参考)条件付き確率 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 確率𝑃 𝐵 が0だと、独立が 定義できなくなってしまう 115
確率の乗法定理 事象の独立性の意味 𝑃 𝐴 𝐵 = 𝑃 𝐴 なら、事象𝐴, 𝐵は独立 →条件𝐵が、あっても、なくても、確率が変わらない! 独立な事象の例 事象𝐴 = 単位を取る 事象𝐵 = サイコロで偶数の目が出る 独立ではない事象の例 事象𝐴 = 単位を取る 事象𝐵 = テストで60点以上を取る 116
クイズ 独立 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 3以下の目が出るという 事象𝐵 = 1,2,3 事象𝐴, 𝐵は、独立か独立でないか ① 独立 ② 独立でない
クイズ(回答) 独立 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 3以下の目が出るという 事象𝐵 = 1,2,3 事象𝐴, 𝐵は、独立か独立でないか ① 独立 ② 独立でない
偶数の目が出るという事象𝐴 = 2,4,6 クイズ(回答)3以下の目が出るという 事象𝐵 = 1,2,3 条件付き確率のイメージ 本来サイコロは6面ある 3以下の目が出た時だけを考える 3分の1の確率で 「偶数の目」が出る 𝑃 𝐴 = 1Τ 2 , 𝑃 𝐴 𝐵 = 1Τ3 𝑃 𝐴 𝐵 ≠ 𝑃 𝐴 なので、𝐴, 𝐵は独立でない 119
クイズ 独立 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 4以下の目が出るという 事象𝐵 = 1,2,3,4 事象𝐴, 𝐵は、独立か独立でないか ① 独立 ② 独立でない
クイズ(回答) 独立 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 4以下の目が出るという 事象𝐵 = 1,2,3,4 事象𝐴, 𝐵は、独立か独立でないか ① 独立 ② 独立でない
クイズ(回答) 条件付き確率と、普通の確率の関係 条件が付くと、確率が増えることも減ることも、 そして変わらないこともある 偶数の目が出るという事象𝐴 = 2,4,6 𝑃 𝐴 = 1ൗ2 増えた 4以上の目が出るという 事象𝐵 = 4,5,6 𝑃 𝐴 𝐵 = 2ൗ3 条件があってもなくても 確率が変わらないので独立 減った 3以下の目が出るという 事象𝐶 = 1,2,3 𝑃 𝐴 𝐶 = 1ൗ3 不変 4以下の目が出るという 事象𝐷 = 1,2,3,4 𝑃 𝐴 𝐷 = 1ൗ2
ベイズの定理 ごく簡単な例の紹介で終わる予定 123
ベイズの定理 ベイズの定理 事象𝐴, 𝐵に対して 𝑃 𝐴𝐵 𝑃 𝐵𝐴 =𝑃 𝐵 𝑃 𝐴 124
ベイズの定理の導出 確率の乗法定理 𝑃 𝐴∪𝐵 =𝑃 𝐴 𝐵 ∙𝑃 𝐵 条件付き確率の定義 𝑃 𝐴∩𝐵 𝑃 𝐵𝐴 = 𝑃 𝐴 よって𝑃 𝐴 ∩ 𝐵 に𝑃 𝐴 𝐵 ∙ 𝑃 𝐵 を代入すればベイズの定理になる 𝑃 𝐴 𝐵 ∙𝑃 𝐵 𝑃 𝐵𝐴 = 𝑃 𝐴 125
ベイズの定理 ベイズの定理と確率の更新 条件が無いときの確率𝑃 𝐵 を、 条件を付けた𝑃 𝐵 𝐴 に「更新」するともみなせる 𝑃 𝐵 ベイズの定理 𝑃 𝐴𝐵 𝑃 𝐵𝐴 =𝑃 𝐵 𝑃 𝐴 確率の「更新」という使いかた 𝑃 𝐵 を事前確率、 𝑃 𝐵 𝐴 を事後確率と呼ぶ 126
ベイズの定理 条件付き確率の、よくある計算ミス 条件が無いときの確率𝑃 𝐵 を、 条件を付けた𝑃 𝐵 𝐴 にどのように「更新」するか これは間違い 𝑃 𝐵 𝑃 𝐵𝐴 = 𝑃 𝐴 ベイズの定理 𝑃 𝐴𝐵 𝑃 𝐵𝐴 =𝑃 𝐵 𝑃 𝐴 𝑃 𝐴∩𝐵 条件付き確率の定義 𝑃 𝐵 𝐴 = 𝑃 𝐴 条件付き確率の分子は同時確率 127
ベイズの定理 ベイズの定理の使い道 事象𝐴, 𝐵に対して、以下で計算される𝑃 𝐴 𝐵 を 「事象𝐵が起こったことが分かった、という条件における 事象𝐴の条件付き確率」と呼ぶ 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 ベイズの定理 𝑃 𝐴𝐵 𝑃 𝐵𝐴 =𝑃 𝐵 𝑃 𝐴 条件の「向き」を逆にするときに便利 128
ベイズの定理 条件の「向き」はとても大切 男性であるという事象を𝐴、犯罪者である事象を𝐵とする 条件付き確率が以下だとする 𝑃 𝐴 𝐵 = 0.7 「犯罪者であるという条件」で7割の人が男性でも、 「男性の7割が犯罪者」ということにはならない!! すなわち𝑃 𝐴 𝐵 = 0.7であっても𝑃 𝐵 𝐴 ≠ 0.7である
𝑃 𝐴𝐵 ベイズの定理 𝑃 𝐵 𝐴 = 𝑃 𝐵 𝑃 𝐴 クイズ ベイズの定理 男性であるという事象を𝐴、犯罪者である事象を𝐵とする 「犯罪者であるという条件」で7割の人が男性だとする 𝑃 𝐴 𝐵 = 0.7 また、ある人が犯罪者である確率を𝑃 𝐵 = 0.0001 また、ある人が男性である確率を𝑃 𝐴 = 0.5とする 「男性であるという条件」でその人が犯罪者な確率 すなわち𝑃 𝐵 𝐴 は? ① 𝟎. 𝟕 ② 𝟎. 𝟏𝟒 ③ 𝟎. 𝟎𝟎𝟎𝟕 ④ 𝟎. 𝟎𝟎𝟎𝟏𝟒
クイズ(回答) 𝑃 𝐴𝐵 ベイズの定理 𝑃 𝐵 𝐴 = 𝑃 𝐵 𝑃 𝐴 ベイズの定理 男性であるという事象を𝐴、犯罪者である事象を𝐵とする 「犯罪者であるという条件」で7割の人が男性だとする 𝑃 𝐴 𝐵 = 0.7 また、ある人が犯罪者である確率を𝑃 𝐵 = 0.0001 また、ある人が男性である確率を𝑃 𝐴 = 0.5とする 「男性であるという条件」でその人が犯罪者な確率 すなわち𝑃 𝐵 𝐴 は? ① 𝟎. 𝟕 ② 𝟎. 𝟏𝟒 ③ 𝟎. 𝟎𝟎𝟎𝟕 ④ 𝟎. 𝟎𝟎𝟎𝟏𝟒
ベイズの定理 𝑃 𝐴𝐵 ベイズの定理 𝑃 𝐵 𝐴 = 𝑃 𝐵 𝑃 𝐴 条件の「向き」はとても大切 男性であるという事象を𝐴、犯罪者である事象を𝐵とする 条件付き確率が以下だとする 𝑃 𝐴 𝐵 = 0.7 「犯罪者であるという条件」で7割の人が男性だとしても、 「男性の7割が犯罪者」ということにはならない!! そもそも「ある人が犯罪者である確率を𝑃 𝐵 」が小さい なので、ベイズの定理を使うと、 「男性であるという条件で、犯罪者である確率」は 小さくなる
統計学 I 第10回:確率分布の基礎1
内容 1.確率分布の基礎 2.確率質量関数 3.確率密度関数 134
確率分布の基礎 135
内容 1.確率分布の基礎 2.いろいろな確率分布 136
内容 1.確率分布の基礎 2.いろいろな確率分布 137
確率分布の基礎 確率変数(厳密な定義ではない) 確率的に変化する値のことだと思うとよい 例:サイコロの出目・コインの裏表 値域 確率変数がとりうる値の全体のこと 逆に言えば、値域以外の値を確率変数は絶対に取らない 実現値 確率変数における具体的な値 例:サイコロを投げたら「4」の目が出た コインを投げたら表が出た 138
確率分布の基礎 離散型の変数:飛び飛びの値 魚の釣獲尾数:0尾、1尾、2尾(0か正の整数のみ) 商品が売れた個数:0個、1個、2個 離散型の確率変数 連続型の変数:連続した値 魚の体長:20cm、19.8524cm(いくらでも細かくできる) 連続型の確率変数 まずは扱いが容易な 離散型の確率変数を対象に説明 139
確率分布の基礎 サイコロを投げた時、どのようなデータが得らえる? 1 1の目: 6 1 2の目: 6 1 3の目: 6 1 4の目: 6 1 5の目: 6 1 6の目: 6 確率分布とは 確率変数と確率の対応 確率変数は○○の確率分布に従うと呼ぶ 140
確率分布の基礎 サイコロ投げと、確率分布・確率変数・実現値の対応 確率変数:サイコロの出目(値域は1,2,3,4,5,6) 1 確率分布: 1の目: 6 1 2の目: 6 1 3の目: 6 1 4の目: 6 1 5の目: 6 1 6の目: 6 実現値:投げてみたら4の目が出た 141
確率分布の基礎 コイン投げと、確率分布・確率変数・実現値の対応 確率変数:コイン投げの結果(値域は表1、裏0) 1 確率分布: 1(表): 2 1 0(裏): 2 実現値:投げてみたら表(1)が出た 142
確率分布の基礎 サイコロ投げの確率分布 出目 1 2 3 4 5 6 確率 1 6 1 6 1 6 1 6 1 6 1 6 コイン投げの確率分布 出た面 1(表) 0(裏) 確率 1 2 1 2 143
確率分布の基礎 確率分布のイメージ 確率の定義から、確率の合計値は1 「全体1」である確率を配分したものが確率分布 (確率分布のことを、単に分布と呼ぶこともある) 動物の分布 ・キリン →アフリカに存在 ・キタキツネ →北海道に存在 コイン投げの確率分布 表であるという事象に0.5 裏であるという事象に0.5 を均等に配分 →確率の合計値は1になる ・コウテイペンギン →南極に存在 144
内容 1.確率分布の基礎 2.いろいろな確率分布 145
確率分布の基礎 コイン投げの確率分布 出た面 1(表) 0(裏) 確率 1 2 1 2 いかさまコインの確率分布 出た面 1(表) 0(裏) 確率 1 3 2 3 確率が均等に分布するとは限らない 確率が偏って分布することもありうる 146
確率分布の基礎 アンケート調査の結果の確率分布 与党支持者数 0人 1人 3人 250人 ⋮ 確率 0.0001 0.0002 0.0003 0.2 ⋮ 500人に与党を支持するか否かを聞いた アンケート結果の確率分布 147
確率質量関数 単に確率関数と呼ぶこともある ただし確率質量関数と呼んだほうが、 後で登場する確率密度関数との対比がしやすい 148
内容 1.確率質量関数が必要になる理由 2.確率質量関数 3.様々な確率質量関数 149
内容 1.確率質量関数が必要になる理由 2.確率質量関数 3.様々な確率質量関数 150
確率質量関数 確率分布の扱いにくい所 確率変数とそれに対応する確率の一覧 ……定義はこの通りだが、 「確率変数とそれに対応する確率の一覧」の羅列は大変 例) 500人中、何人が与党を支持したか 0人支持する確率:〇% 1人支持する確率:〇% 2人支持する確率:〇%・・・・・・以下501通り 501行の数表を作る必要があって大変 151
内容 1.確率質量関数が必要になる理由 2.確率質量関数 3.様々な確率質量関数 152
確率質量関数 確率質量関数 確率変数を指定すると、確率がすぐ出てくる関数 確率変数を𝑋、実現値を𝑥𝑖 とする。 𝑃 𝑋 = 𝑥𝑖 = 𝑓 𝑥𝑖 として与えられるとき 𝑓 𝑥𝑖 を確率質量関数と呼ぶ 数式を使って確率分布を表現すると、 膨大な数表を使わなくて済むので便利 153
確率質量関数 確率質量関数の性質 確率の定義を満たす必要があることに注意 →確率は0以上1以下であり、確率の合計は1になる よって、確率質量関数は以下を満たす ∞ 𝑓 𝑥𝑖 ≥ 0 𝑓 𝑥𝑖 = 1 𝑖=1 確率変数の値域を∞とみなしている もちろん、値域を狭めても良い 確率質量関数を使って 確率分布を表記することは頻繁にある 154
確率質量関数 確率質量関数の例 確率変数を𝑋、実現値を𝑥𝑖 とする。 ただし𝑥𝑖 は100面ダイスの出目であり 𝑥𝑖 = 1,2, … , 99,100 このときの確率質量関数を以下とする。 1 𝑓 𝑥𝑖 = 100 この確率質量関数は以下を満たす 100 𝑓 𝑥𝑖 ≥ 0 𝑓 𝑥𝑖 = 1 𝑖=1 100行の数表を作るよりかは楽 155
確率質量関数 確率分布と確率質量関数の関係 確率質量関数があれば、即座に確率分布がわかる サイコロ投げの例 値域を{1,2,3,4,5,6}とする 出目 確率質量関数 1 𝑓 𝑥𝑖 = 6 確率分布 両者は同じ意味 1 2 3 4 5 6 確率 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6
内容 1.確率質量関数が必要になる理由 2.確率質量関数 3.様々な確率質量関数 ① 一様分布 ② 確率分布を作ってみよう 157
確率質量関数 一様分布(離散型) 確率がすべて一様に、等しく分配された確率分布のこと 確率変数を𝑋、実現値を𝑥1 , 𝑥2 , … , 𝑥𝑛 とする。 このときの確率質量関数𝑓は以下となる 1 U 𝑋𝑛 = 𝑛 ただし𝑛 > 0 他の確率分布と見分けをつけるた めU 𝑋 𝑛 と表記している 158
確率質量関数 一様分布(離散型) 確率がすべて一様に、等しく分配された確率分布のこと 確率変数を𝑋、実現値を𝑥1 , 𝑥2 , … , 𝑥𝑛 とする。 このときの確率質量関数𝑓は以下となる 1 U 𝑋𝑛 = 𝑛 ただし𝑛 > 0 縦棒の右側は、確率分布の形状を変化させるパラメータ 一様分布は、 𝑛が変わると、確率分布も変化する 159
確率質量関数 一様分布(離散型) 確率がすべて一様に、等しく分配された確率分布のこと 確率変数を𝑋、実現値を𝑥1 , 𝑥2 , … , 𝑥𝑛 とする。 このときの確率質量関数𝑓は以下となる 1 U 𝑋𝑛 = 𝑛 一様分布の例 𝑛 = 6とする。このときの確率質量関数𝑓は以下となる 1 U 𝑋𝑛 = 6 サイコロの確率分布は𝑛 = 6の一様分布 160
確率質量関数 確率変数と確率分布 ある確率変数𝑋が、ある確率分布に従うことを、 チルダ記号( ~ )を使って表記する サイコロの例 𝑋~U 𝑋 6 161
確率質量関数 一様分布(離散型) 一様分布は確率分布なので、 この確率質量関数は以下を満たす(𝑛 > 0なことに注意) 𝑛 𝑓 𝑥𝑖 ≥ 0 𝑓 𝑥𝑖 = 1 𝑖=1 𝑛 1 ≥0 𝑛 1 =1 𝑛 𝑖=1 162
確率質量関数 一様分布は「確率分布のグループ」 のようなイメージ 一様分布は、様々な確率分布を表現できる 一様分布の確率質量関数ただし𝑛 > 0 1 U 𝑋𝑛 = 𝑛 𝑛の値を変えると、確率分布も変わる 例) 𝑛 = 2、値域{0,1}がなら、コイン投げの確率分布 𝑛 = 6 、値域{1,2,3,4,5,6}なら、サイコロの確率分布 パラメータ𝑛を変えることで、 色々な確率分布を作ることができる 163
内容 1.確率質量関数が必要になる理由 2.確率質量関数 3.様々な確率質量関数 ① 一様分布 ② 確率分布を作ってみよう 164
確率質量関数 オリジナルな確率分布を作ってみた 確率変数を𝑋とする。値域は 1,3 実現値を𝑥1 = 1, 𝑥2 = 3とする。 このときの確率質量関数を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖 + 0.1 名もなきオリジナルな確率分布 165
確率質量関数 オリジナルな確率分布を作ってみた 確率変数を𝑋とする。値域は 1,3 実現値を𝑥1 = 1, 𝑥2 = 3とする。 このときの確率質量関数を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖 + 0.1 確率分布と言えるかどうかチェック 2 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 2 𝑓 𝑥1 = 0.2 × 1 + 0.1 = 0.3 ≥ 0 𝑓 𝑥2 = 0.2 × 3 + 0.1 = 0.7 ≥ 0 𝑓 𝑥𝑖 = 0.3 + 0.7 = 1 𝑖=1 166
クイズ 3 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 確率質量関数 確率変数を𝑋とする。値域は 1,2,3 実現値を𝑥1 = 1, 𝑥2 = 2 , 𝑥3 = 3とする。 このときの関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.1 × 𝑥𝑖 + 0.1 関数𝑓 𝑥𝑖 は確率質量関数と言えるか? 言えないか? ① 確率質量関数である ② 確率質量関数でない
クイズ(回答) 3 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 確率質量関数 確率変数を𝑋とする。値域は 1,2,3 実現値を𝑥1 = 1, 𝑥2 = 2 , 𝑥3 = 3とする。 このときの関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.1 × 𝑥𝑖 + 0.1 関数𝑓 𝑥𝑖 は確率質量関数と言えるか? 言えないか? ① 確率質量関数である ② 確率質量関数でない
クイズ(回答) 3 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 確率質量関数 確率変数を𝑋とする。値域は 1,2,3 実現値を𝑥1 = 1, 𝑥2 = 2 , 𝑥3 = 3とする。 𝑓 𝑥𝑖 = 0.1 × 𝑥𝑖 + 0.1 確率分布と言えるかどうかチェック 3 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 3 𝑓 𝑥1 = 0.1 × 1 + 0.1 = 0.2 𝑓 𝑥2 = 0.1 × 2 + 0.1 = 0.3 𝑓 𝑥3 = 0.1 × 3 + 0.1 = 0.4 𝑓 𝑥𝑖 = 0.2 + 0.3 + 0.4 = 0.9 𝑖=1 足しても1にならない
クイズ 3 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 確率質量関数 確率変数を𝑋とする。値域は 1,2,3 実現値を𝑥1 = 1, 𝑥2 = 2 , 𝑥3 = 3とする。 このときの関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 − 0.6 関数𝑓 𝑥𝑖 は確率質量関数と言えるか? 言えないか? ① 確率質量関数である ② 確率質量関数でない
クイズ(回答) 3 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 確率質量関数 確率変数を𝑋とする。値域は 1,2,3 実現値を𝑥1 = 1, 𝑥2 = 2 , 𝑥3 = 3とする。 このときの関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 − 0.6 関数𝑓 𝑥𝑖 は確率質量関数と言えるか? 言えないか? ① 確率質量関数である ② 確率質量関数でない
クイズ(回答) 3 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 確率質量関数 確率変数を𝑋とする。値域は 1,2,3 実現値を𝑥1 = 1, 𝑥2 = 2 , 𝑥3 = 3とする。 このときの関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 − 0.6 関数𝑓 𝑥𝑖 は確率質量関数と言えるか? 言えないか? 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥1 = 0.2 × 1 − 0.6 = −0.4 𝑓 𝑥2 = 0.2 × 4 − 0.6 = 0.2 𝑓 𝑥3 = 0.2 × 9 − 0.6 = 1.2 確率が負になる
クイズ 2 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 確率質量関数 確率変数を𝑋とする。値域は 1,2 実現値を𝑥1 = 1, 𝑥2 = 2 とする。 このときの関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 関数𝑓 𝑥𝑖 は確率質量関数と言えるか? 言えないか? ① 確率質量関数である ② 確率質量関数でない
クイズ(回答) 2 𝑓 𝑥𝑖 ≥ 0 か? 𝑓 𝑥𝑖 = 1 か? 𝑖=1 確率質量関数 確率変数を𝑋とする。値域は 1,2 実現値を𝑥1 = 1, 𝑥2 = 2 とする。 このときの関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 関数𝑓 𝑥𝑖 は確率質量関数と言えるか? 言えないか? ① 確率質量関数である ② 確率質量関数でない
確率密度関数 175
内容 1.連続型の変数における確率の考え方 2.確率密度関数 3.「確率の計算」と「面積の計算」 4.積分計算の復習 5.様々な確率密度関数 176
内容 1.連続型の変数における確率の考え方 2.確率密度関数 3.「確率の計算」と「面積の計算」 4.積分計算の復習 5.様々な確率密度関数 177
確率密度関数 離散型の変数:飛び飛びの値 魚の釣獲尾数:0尾、1尾、2尾(0か正の整数のみ) 商品が売れた個数:0個、1個、2個 離散型の確率変数 連続型の変数:連続した値 魚の体長:20cm、19.8524cm(いくらでも細かくできる) 連続型の確率変数 次の対象は、連続型の確率変数 離散型とどのように変わる? 178
確率密度関数 20cm? 19.87654372 . . . . .cm? 厳密に20cm丁度である体長はあり得ない 魚の体長が20cm丁度になる確率は0 179
確率密度関数 確率密度 ものすごく小さい(限りなく0に近い)範囲に データが収まる確率 魚の体長の例 魚の体長が20cm~20+Δcmの範囲に収まる確率 →「Δ」と書いて「デルタ」と読む →Δは、限りなく0に近い正の値とする 連続型の確率変数の場合には 「狭い範囲」にデータが収まる確率を考える 180
内容 1.連続型の変数における確率の考え方 2.確率密度関数 3.「確率の計算」と「面積の計算」 4.積分計算の復習 5.様々な確率密度関数 181
確率密度関数 確率密度 ものすごく小さい(限りなく0に近い)範囲に データが収まる確率 確率密度関数 確率変数を指定すると、確率密度がすぐ出てくる関数 182
確率密度関数 確率密度関数の特徴 確率密度関数は常に0以上 すなわち、確率密度関数を𝑓 𝑥 、実数の集合をℝとすると 任意の𝑥 ∈ ℝにおいて、𝑓 𝑥 ≥ 0 また、確率の積分値は1になる ∞ න 𝑓 𝑥 𝑑𝑥 = 1 −∞ 合計(Σ記号)の代わりに 積分を使う 183
確率密度関数 確率密度から確率を計算する方法 確率密度関数の下側の面積が確率になる 面積1に標準化されたヒストグラムと似たような扱い 積分計算によって求められる 𝑏 𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = න 𝑓 𝑥 𝑑𝑥 𝑎 184
内容 1.連続型の変数における確率の考え方 2.確率密度関数 3.「確率の計算」と「面積の計算」 4.積分計算の復習 5.様々な確率密度関数 185
確率密度関数 積分計算の復習 積分をすることによって、関数𝑓 𝑥 の下側の面積を 求めることができる →確率と面積の対応関係が重要 密度と質量 密度×体積=質量となる この場合の「質量」とは確率のこと 確率質量関数は、そのままの確率を出力する しかし確率密度関数は確率の「密度」を出力する 「密度」を用いて「質量(確率)」を求めるために積分する 186
階級 度数 相対度数 ヒストグラム 155~164.9㎝ 5 0.2 165~174.9㎝ 12 0.48 ヒストグラム 175~184.9㎝ 6 0.24 (面積を相対度数にした) 185~194.9㎝ 2 0.08
階級 度数 相対度数 ヒストグラム 155~164.9㎝ 5 0.2 165~174.9㎝ 12 0.48 ヒストグラム 175~184.9㎝ 6 0.24 (面積を相対度数にした) 185~194.9㎝ 2 0.08 相対度数分布と、桁が1 つずれているが、 これが正しい
階級 度数 相対度数 ヒストグラム 155~164.9㎝ 5 0.2 165~174.9㎝ 12 0.48 ヒストグラム 175~184.9㎝ 6 0.24 (面積を相対度数にした) 185~194.9㎝ 2 0.08 この棒に着目
ヒストグラム ヒストグラムと相対度数 ヒストグラムの面積が 相対度数を表す 横幅10 階級 度数 相対度数 155~164.9㎝ 5 0.2 165~174.9㎝ 12 0.48 175~184.9㎝ 6 0.24 185~194.9㎝ 2 0.08 棒の面積は0.2であり、 相対度数と一致する 高さ 0.02 190
階級 度数 相対度数 ヒストグラム 155~164.9㎝ 5 0.2 165~174.9㎝ 12 0.48 ヒストグラム 175~184.9㎝ 6 0.24 (面積を相対度数にした) 185~194.9㎝ 2 0.08 (階級幅を変化させた) 175~195で、階級幅が広い ただし、相対度数を足し合わ せてはいけない 高さ 0.016
階級 度数 相対度数 ヒストグラム 155~164.9㎝ 5 0.2 165~174.9㎝ 12 0.48 ヒストグラム 175~184.9㎝ 6 0.24 (面積を相対度数にした) 185~194.9㎝ 2 0.08 (階級幅を変化させた) 棒の面積は0.24 + 0.08 = 0.32であり、 相対度数の和と一致する 横幅20(175~195) 高さ 0.016
ヒストグラム ヒストグラム 度数分布をグラフで表したもの →ヒストグラムの面積が度数と比例する ヒストグラムと相対度数分布の関係 ヒストグラムの「面積」を、 相対度数分布と対応させる図をしばしば利用する →縦軸は、度数でも、相対度数でもない! →「面積」が相対度数 「確率密度関数」の場合も同じく 「面積」が確率になることに注意
確率密度関数 確率密度 ものすごく小さい(限りなく0に近い)範囲に データが収まる確率 194
階級 度数 相対度数 ヒストグラム 155~164.9㎝ 5 0.2 165~174.9㎝ 12 0.48 ヒストグラム 175~184.9㎝ 6 0.24 (面積を相対度数にした) 185~194.9㎝ 2 0.08 この棒に着目
ヒストグラム ヒストグラムと相対度数 ヒストグラムの面積が 相対度数を表す 横幅10 階級 度数 相対度数 155~164.9㎝ 5 0.2 165~174.9㎝ 12 0.48 175~184.9㎝ 6 0.24 185~194.9㎝ 2 0.08 棒の面積は0.2であり、 相対度数と一致する 高さ 0.02 横幅10の範囲に データが収まる割合 196
確率密度関数 確率密度 ものすごく小さい(限りなく0に近い)範囲にデータが収まる確率 横幅10 棒の面積は0.2であり、 相対度数と一致する 高さ 0.02 横幅10の範囲に データが収まる割合 ヒストグラムの横幅を狭くするイメージ 197
内容 1.連続型の変数における確率の考え方 2.確率密度関数 3.「確率の計算」と「面積の計算」 4.積分計算の復習 5.様々な確率密度関数 198
積分計算の復習 確率密度から確率を計算する方法 確率密度関数の下側の面積が確率になる 確率変数が𝑎から𝑏の範囲に入る確率は、以下のように計算 𝑏 𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = න 𝑓 𝑥 𝑑𝑥 𝑎 積分計算って? 高校の復習 199
積分計算の復習 確率密度 確率密度関数の折れ線グラフ この範囲の面積 a b 確率変数 𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 として、上記の面積を求める
積分計算の復習 確率密度 横幅1のヒストグラムを作って、面積を計算 この範囲の面積 a b 確率変数 ヒストグラムと折れ線グラフがずれている
積分計算の復習 確率密度 横幅が小さなヒストグラムで面積を表す この範囲の面積 a b 確率変数 ヒストグラムと折れ線グラフがほぼ一致
積分計算の復習 ヒストグラムの面積の合計 ヒストグラムの1つの棒の横幅を∆𝑥、確率密度関数を𝑓 𝑥𝑖 、 𝑎から𝑏の範囲のヒストグラムの棒の数を𝑛とする 𝑛 ヒストグラムの面積 = 𝑓 𝑥𝑖 × ∆𝑥 𝑖=1 高さ 横幅 203
積分計算の復習 ヒストグラムの面積の合計 ヒストグラムの1つの棒の横幅を∆𝑥、確率密度関数を𝑓 𝑥𝑖 、 𝑎から𝑏の範囲のヒストグラムの棒の数を𝑛とする 𝑛 ヒストグラムの面積 = 𝑓 𝑥𝑖 × ∆𝑥 𝑖=1 ヒストグラムの棒の横幅を限りなく小さくする ヒストグラムの棒の数𝑛を無限に増やすことで、 ヒストグラムの1つの棒の横幅を∆𝑥を限りなく0に近づける 𝑛 ヒストグラムの面積 = lim 𝑓 𝑥𝑖 × ∆𝑥 𝑛→∞ これが積分 𝑖=1 𝑏 = න 𝑓 𝑥 𝑑𝑥 𝑎 204
積分計算の復習 離散型の確率変数の場合の確率の計算 1から3の範囲にデータが入る確率を計算 確率質量関数を𝑓 𝑥𝑖 とする 3 𝑃 1 ≤ 𝑋 ≤ 3 = 𝑓 𝑥𝑖 𝑖=1 連続型の確率変数の場合の確率の計算 1から3の範囲にデータが入る確率を計算 確率密度関数を𝑓 𝑥 とする 3 𝑃 1 ≤ 𝑋 ≤ 3 = න 𝑓 𝑥 𝑑𝑥 1 離散型は足し算。連続型は積分 205
内容 1.連続型の変数における確率の考え方 2.確率密度関数 3.「確率の計算」と「面積の計算」 4.積分計算の復習 5.様々な確率密度関数 206
さまざまな確率密度関数 一様分布(連続型) 確率がすべて一様に、等しく分配された確率分布のこと 確率変数を𝑋、 𝑋の値域(とりうる範囲)を𝛼以上𝛽以下とする このときの確率密度関数𝑓は以下となる 1 U 𝑋 𝛼, 𝛽 = 𝛽−𝛼 ただし𝛼 < 𝛽。また、値域以外では確率密度は常に0 以下の証明は略するが、ちゃんと成り立つ 任意の𝑥 ∈ ℝにおいて、𝑓 𝑥 ≥ 0 また、確率の積分値は1になる 𝛽 න 𝑓 𝑥 𝑑𝑥 = 1 𝛼 207
さまざまな確率密度関数 一様分布(連続型) 確率がすべて一様に、等しく分配された確率分布のこと 確率変数を𝑋、 𝑋の値域(とりうる範囲)を𝛼以上𝛽以下とする このときの確率密度関数𝑓は以下となる 1 U 𝑋 𝛼, 𝛽 = 𝛽−𝛼 ただし𝛼 < 𝛽。また、値域以外では確率密度は常に0 一様分布の例 𝛼 = 1, 𝛽 = 3とする。この時の確率密度関数𝑓は以下となる 1 1 U 𝑋𝑛 = = 3−1 2 208
さまざまな確率密度関数 正規分布 今後登場する確率分布(今日は名前だけ紹介) 利用する頻度が高い 確率密度関数はやや複雑なので、今日は省略 209
統計学 I 第11回:確率分布の基礎2
内容 1.確率分布の復習 2.確率変数の期待値 3.確率変数の分散 211
確率分布の復習 212
確率変数の期待値 213
内容 1.期待値の基礎 2.期待値の解釈 3.確率質量関数から期待値を計算する 4.確率密度関数から期待値を計算する 214
内容 1.期待値の基礎 2.期待値の解釈 3.確率質量関数から期待値を計算する 4.確率密度関数から期待値を計算する 215
期待値の基礎 期待値の直感的な説明 平均値と同様に解釈できる指標 「まだ手に入れていない、 未知データにも適用できる平均値(予想値) 」 「長い目で見たときの、平均値」 確率変数に対して適用する 「平均値」のような意味合いの指標 216
期待値の基礎 期待値の定義 確率変数において、以下で計算される値のこと 期待値=「確率×その時の値」の合計 (連続型の確率変数を相手にする場合は積分する) 期待値の表記法 確率変数𝑋の期待値を𝐸 𝑋 と表記する (確率変数が𝑌なら、期待値は𝐸 𝑌 と表記される) 期待値は短く𝜇と表記することもある 217
期待値=「確率×その時の値」の合計 期待値の基礎 期待値の計算例 コイン投げ結果という確率変数に対して、期待値を計算 コイン投げの確率分布 出た面 1(表) 0(裏) 確率 1 2 1 2 期待値=「確率×その時の値」の合計 1 1 1 =1× +0× = 2 2 2 218
期待値=「確率×その時の値」の合計 クイズ 期待値 下記の「いかさまコイン」における期待値を求めよ コイン投げの確率分布 出た面 1(表) 0(裏) 𝟏 ① 𝟐 𝟏 ② 𝟑 確率 1 3 2 3 𝟏 ③ 𝟔 𝟐 ④ 𝟑
期待値=「確率×その時の値」の合計 クイズ(回答) 期待値 下記の「いかさまコイン」における期待値を求めよ コイン投げの確率分布 出た面 1(表) 0(裏) 𝟏 ① 𝟐 𝟏 ② 𝟑 確率 1 3 2 3 𝟏 ③ 𝟔 𝟐 ④ 𝟑
期待値=「確率×その時の値」の合計 クイズ(回答) 期待値 下記の「いかさまコイン」における期待値を求めよ コイン投げの確率分布 出た面 1(表) 0(裏) 確率 1 3 2 3 期待値=「確率×その時の値」の合計 1 2 1 =1× +0× = 3 3 3
期待値=「確率×その時の値」の合計 クイズ 期待値 表が出たら1万円、裏が出たら何ももらえない賭けがある この賭けの期待値を求めよ もらえる金額の確率分布 金額 1万円 0円 ① 1万円 ② 5000円 ③ 3000円 確率 3 10 7 10 ④ 7000円 222
期待値=「確率×その時の値」の合計 クイズ(回答) 期待値 表が出たら1万円、裏が出たら何ももらえない賭けがある この賭けの期待値を求めよ もらえる金額の確率分布 金額 1万円 0円 ① 1万円 ② 5000円 ③ 3000円 確率 3 10 7 10 ④ 7000円 223
期待値=「確率×その時の値」の合計 クイズ(回答) 期待値 表が出たら1万円、裏が出たら何ももらえない賭けがある この賭けの期待値を求めよ もらえる金額の確率分布 金額 1万円 0円 確率 3 10 7 10 期待値=「確率×その時の値」の合計 3 7 = 3000 = 10000 × +0× 10 10 224
期待値=「確率×その時の値」の合計 クイズ 期待値 表が出たら1万円もらえ、裏が出たら1万円失う賭けがある この賭けの期待値を求めよ もらえる金額の確率分布 金額 1万円 -1万円 ① 3000円 ② -3000円 ③ -4000円 確率 3 10 7 10 ④ -7000円 225
期待値=「確率×その時の値」の合計 クイズ(回答) 期待値 表が出たら1万円もらえ、裏が出たら1万円失う賭けがある この賭けの期待値を求めよ もらえる金額の確率分布 金額 1万円 -1万円 ① 3000円 ② -3000円 ③ -4000円 確率 3 10 7 10 ④ -7000円 226
期待値=「確率×その時の値」の合計 クイズ(回答) 期待値 表が出たら1万円もらえ、裏が出たら1万円失う賭けがある この賭けの期待値を求めよ 金額 もらえる金額の確率分布 1万円 -1万円 確率 3 10 7 10 期待値=「確率×その時の値」の合計 3 7 = 10000 × + −10000 × 10 10 = 3000 − 7000 = −4000 227
内容 1.期待値の基礎 2.期待値の解釈 3.確率質量関数から期待値を計算する 4.確率密度関数から期待値を計算する 228
期待値の解釈 期待値の直感的な説明 平均値と同様に解釈できる指標 「まだ手に入れていない、 未知データにも適用できる平均値(予想値)」 「長い目で見たときの、平均値」 期待値の解釈を「直観的に」紹介 229
期待値の解釈 期待値の直感的な説明 平均値と同様に解釈できる指標 「まだ手に入れていない、 未知データにも適用できる平均値(予想値)」 「長い目で見たときの、平均値」 手に入れていないデータで、どうやって平均値を計算する? 230
期待値の解釈 賭けに参加するかどうか 表が出たら1万円、裏が出たら何ももらえない賭けがある ★賭けに参加するのに5000円かかる★ もらえる金額の確率分布 金額 1万円 確率 3Τ10 0円 7Τ10 あなたならば、この賭けに参加する? それとも参加しない? 231
期待値=「確率×その時の値」の合計 期待値の解釈 賭けに参加するかどうか 表が出たら1万円、裏が出たら何ももらえない賭けがある ★賭けに参加するのに5000円かかる★ もらえる金額の確率分布 金額 1万円 確率 3Τ10 0円 7Τ10 期待値=「確率×その時の値」の合計 3 7 = 3000 = 10000 × +0× 10 10 期待値3000円の意味とは? 232
期待値の解釈 賭けに参加するかどうか 表が出たら1万円、裏が出たら何ももらえない賭けがある ★賭けに参加するのに5000円かかる★ もらえる金額の確率分布 金額 1万円 確率 3Τ10 0円 7Τ10 賭けは、当たったり外れたりする 「平均的に」もらえる金額で判断 しよう 233
金額 1万円 0円 期待値の解釈 確率 3Τ10 7Τ10 賭けに参加するかどうか 表が出たら1万円、裏が出たら何ももらえない賭けがある ★賭けに参加するのに5000円かかる★ 賭けに10回参加する →10回の平均受取金額を計算する 1万円 1万円 1万円 0円 0円 0円 0円 0円 0円 0円 10回賭けに参加すると、 おそらく3回ほどあたりが出るはず 234
金額 1万円 0円 期待値の解釈 確率 3Τ10 7Τ10 賭けに参加するかどうか 表が出たら1万円、裏が出たら何ももらえない賭けがある ★賭けに参加するのに5000円かかる★ 賭けに10回参加する →10回の平均受取金額を計算する 1万円 1万円 1万円 0円 0円 0円 0円 0円 0円 0円 平均受取金額の予想 10000 + 10000 + 10000 + 0 + 0 + 0 + 0 + 0 + 0 + 0 = 3000 10
期待値の解釈 期待値の直感的な説明 平均値と同様に解釈できる指標 「まだ手に入れていない、 未知データにも適用できる平均値(予想値)」 「長い目で見たときの、平均値」 まだ賭けには参加していない。このとき 「もしも賭けに何度も参加したならば、 平均して3000円くらいの金額が得らえるだろう」 →この3000円が期待値 →参加金額が5000円なのだとしたら、 「平均的に見ると」損をしてしまうだろうと予想できる 236
期待値の解釈 期待値の直感的な説明 平均値と同様に解釈できる指標 「まだ手に入れていない、 未知データにも適用できる平均値(予想値)」 「長い目で見たときの、平均値」 「長い目」で見るとは? 237
期待値の解釈 実現値の例 コイン投げ結果という確率変数の実現値を20回取得 コイン投げの確率分布 出た面 確率 1 2 1 2 1(表) 0(裏) 表が8回 裏が12回 表 裏 裏 表 裏 表 表 裏 裏 裏 裏 裏 裏 表 表 裏 表 裏 表 裏 確率分布と比べて、裏がやや多くなった 238
期待値の解釈 確率変数と実現値 確率変数は確率的に結果が変わる そのため、たまたま表が多く出たり裏が多く出たりする 表が8回 裏が12回 表 裏 裏 表 裏 表 表 裏 裏 裏 裏 裏 裏 表 表 裏 表 裏 表 裏 例えばコインを2回だけ投げて、すべて裏だったとする 裏 裏 この結果を見て「これはイカサマだ」と主張するのは 無理がありそう 239
期待値の解釈 ダメそうな推論の仕方 スマホゲームで10連ガチャを回しても当たりキャラが出ない ↓ このガチャは、当たりキャラが一人も入ってない。不正だ! 根拠のないクレームでは?
期待値の解釈 ダメそうな推論の流れ Step1.データ取得:10連ガチャを回す 結果:当たりキャラが出ない ↓ Step2.未知のデータに対する推測 このガチャでは、当たりキャラ出現率が0%である! ↓ Step3.予測 誰が回しても、ガチャで当たりなんか出ないよ!!! この推測・予測は明らかに間違い 確率的に、当たったり外れたりするはず
金額 1万円 0円 期待値の解釈 確率 3Τ10 7Τ10 賭けに参加するかどうか 表が出たら1万円、裏が出たら何ももらえない賭けがある ★賭けに参加するのに5000円かかる★ 賭けに10回参加する →10回の平均受取金額を計算する 1万円 1万円 1万円 0円 0円 0円 0円 1万円 0円 1万円 10回賭けに参加すると、「たまたま」 当たりが多く出ることもある 242
金額 1万円 0円 期待値の解釈 確率 3Τ10 7Τ10 賭けに参加するかどうか 表が出たら1万円、裏が出たら何ももらえない賭けがある ★賭けに参加するのに5000円かかる★ 賭けに10回参加する →10回の平均受取金額を計算する 1万円 0円 1万円 0円 0円 0円 0円 0円 0円 0円 10回賭けに参加すると、「たまたま」 当たりが少なく出ることもある 243
期待値の解釈 金額 1万円 0円 確率 3Τ10 7Τ10 賭けに参加するかどうか 表が出たら1万円、裏が出たら何ももらえない賭けがある ★賭けに参加するのに5000円かかる★ 賭けに何度も参加する→その平均受取金額を計算する 1万円 0円 1万円 0円 0円 1万円 0円 1万円 0円 0円 1万円 0円 1万円 0円 1万円 0円 0円 0円 0円 0円 1万円 0円 0円 0円 0円 1万円 0円 0円 0円 0円 0円 1万円 0円 1万円 0円 0円 1万円 0円 0円 0円 賭けに何度も、何度も、何度も参加する →平均受取金額は3000円に収束する 244
期待値の解釈 期待値の直感的な説明 平均値と同様に解釈できる指標 「まだ手に入れていない、 未知データにも適用できる平均値(予想値)」 「長い目で見たときの、平均値」 何度も、何度も、何度も、何度も賭けに参加する 「無限にも及ぶ回数、賭けに参加したならば、 平均して3000円くらいの金額が得られるだろう」 →この3000円が期待値 →参加金額が5000円なのだとしたら、 「平均的に見ると」損をしてしまうだろうと予想できる 245
期待値の解釈 期待値の直感的な説明 平均値と同様に解釈できる指標 「まだ手に入れていない、 未知データにも適用できる平均値(予想値)」 「長い目で見たときの、平均値」 確率変数と期待値 確率変数は確率的に結果が変わる →この確率変数を、何度も、何度も取得したならば その平均値は期待値と一致するだろう 期待値は、確率変数における 「代表値」のような使い勝手の指標 246
期待値の解釈(Web版追記) 期待値と予想値について 松原・縄田・中井(1991),東京大学出版会 『統計学入門』pp94-95を参考にした (「予想値」という表現はこの本に依る) 期待値と「長い目で見た平均値」について 大数の法則からほぼ自明 日本統計学会編(2015),東京図書 『改訂版 日本統計学会公式認定 統計検定2級対応 統計学基礎』などを参考にした 247
内容 1.期待値の基礎 2.期待値の解釈 3.確率質量関数から期待値を計算する 4.確率密度関数から期待値を計算する 248
確率質量関数と期待値 期待値の定義 確率変数において、以下で計算される値のこと 期待値=「確率×その時の値」の合計 (連続型の確率変数を相手にする場合は積分する) 確率質量関数 確率変数を指定すると、確率がすぐ出てくる関数 確率変数を𝑋、実現値を𝑥𝑖 とする(𝑖 = 1,2, … , 𝑛)。 𝑃 𝑋 = 𝑥𝑖 = 𝑓 𝑥𝑖 として与えられるとき 𝑓 𝑥𝑖 を確率質量関数と呼ぶ 𝑛 確率質量関数から期待値を計算する 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 249
確率質量関数と期待値 一様分布(離散型) 確率がすべて一様に、等しく分配された確率分布のこと 確率変数を𝑋、実現値を𝑥1 , 𝑥2 , … , 𝑥𝑛 とする このときの確率質量関数𝑓は以下となる 1 U 𝑋𝑛 = 𝑛 ただし𝑛 > 0 一様分布(離散型)の期待値 確率質量関数𝑓をU 𝑋 2 = 1Τ2と、 𝑥1 = 1, 𝑥2 = 2とする 期待値は以下のように計算される 2 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 = 𝑓 𝑥1 ∙ 𝑥1 + 𝑓 𝑥2 ∙ 𝑥2 𝑖=1 1 1 3 = ×1+ ×2 = 2 2 2 250
確率質量関数と期待値 サイコロの確率分布の期待値 サイコロの出目の確率質量関数𝑓をU 𝑋 6 = 1Τ6とし、 𝑥1 = 1, 𝑥2 = 2, 𝑥3 = 3, 𝑥4 = 4, 𝑥5 = 5, 𝑥6 = 6とする 期待値は以下のように計算される 6 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 = 𝑓 𝑥1 ∙ 𝑥1 + 𝑓 𝑥2 ∙ 𝑥2 + 𝑓 𝑥3 ∙ 𝑥3 +𝑓 𝑥4 ∙ 𝑥4 + 𝑓 𝑥5 ∙ 𝑥5 + 𝑓 𝑥6 ∙ 𝑥6 1 1 1 1 1 1 = ×1+ ×2+ ×3+ ×4+ ×5+ ×6 6 6 6 6 6 6 7 21 = 3.5 = = 251 2 6
𝑛 クイズ 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 確率質量関数の期待値 確率変数を𝑋とする。値域は 1,2 。 実現値を𝑥1 = 1, 𝑥2 = 2 とする。 このときの確率質量関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 確率変数𝑋の期待値を求めよ ① 𝟏 ② 𝟏. 𝟒 ③ 𝟏. 𝟖 ④ 𝟐. 𝟐
𝑛 クイズ(回答) 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 確率質量関数の期待値 確率変数を𝑋とする。値域は 1,2 。 実現値を𝑥1 = 1, 𝑥2 = 2 とする。 このときの確率質量関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 確率変数𝑋の期待値を求めよ ① 𝟏 ② 𝟏. 𝟒 ③ 𝟏. 𝟖 ④ 𝟐. 𝟐
2 クイズ(回答) 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 確率質量関数の期待値 確率変数を𝑋とする。値域は 1,2 。 実現値を𝑥1 = 1, 𝑥2 = 2 とする。 このときの確率質量関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 確率変数𝑋の期待値を求めよ 𝑛 𝐸 𝑋 = 0.2 × 𝑥𝑖2 ∙ 𝑥𝑖 = 0.2 × 𝑥12 ∙ 𝑥1 + 0.2 × 𝑥22 ∙ 𝑥2 𝑖=1 = 0.2 × 12 × 𝑥1 + 0.2 × 22 × 𝑥2 = 0.2 × 𝑥1 + 0.8 × 𝑥2 = 0.2 × 1 + 0.8 × 2 = 1.8
内容 1.期待値の基礎 2.期待値の解釈 3.確率質量関数から期待値を計算する 4.確率密度関数から期待値を計算する 255
確率密度関数と期待値 離散型の確率変数の場合の確率の計算 1から3の範囲にデータが入る確率を計算 確率質量関数を𝑓 𝑥𝑖 とする 3 𝑃 1 ≤ 𝑋 ≤ 3 = 𝑓 𝑥𝑖 𝑖=1 連続型の確率変数の場合の確率の計算 1から3の範囲にデータが入る確率を計算 確率密度関数を𝑓 𝑥 とする 3 𝑃 1 ≤ 𝑋 ≤ 3 = න 𝑓 𝑥 𝑑𝑥 1 離散型は足し算。連続型は積分 256
確率密度関数と期待値 離散型の確率変数の場合の期待値の計算 確率変数を𝑋とし、実現値を𝑥1 , 𝑥2 , … , 𝑥𝑛 とする 確率質量関数を𝑓 𝑥𝑖 とする 𝑛 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 連続型の確率変数の場合の期待値の計算 確率変数を𝑋とし、その値域は−∞から∞とする 実現値を𝑥とし、確率密度関数を𝑓 𝑥 とする ∞ 𝐸 𝑋 = න 𝑓 𝑥 ∙ 𝑥 𝑑𝑥 −∞ 離散型は足し算。連続型は積分 257
確率密度関数と期待値 一様分布(連続型) 確率がすべて一様に、等しく分配された確率分布のこと 確率変数を𝑋、 𝑋の値域を𝛼以上𝛽以下とする このときの確率密度関数𝑓は以下となる 1 U 𝑋 𝛼, 𝛽 = 𝛽−𝛼 ただし𝛼 < 𝛽。また、値域以外では確率密度は常に0 一様分布の期待値 𝛽 𝛽 1 𝐸 𝑋 = න 𝑓 𝑥 ∙ 𝑥 𝑑𝑥 = න ∙ 𝑥 𝑑𝑥 𝛼 𝛼 𝛽−𝛼 まずは、期待値の意味が分かればOK 258
確率密度関数と期待値 一様分布の期待値計算の詳細 𝛽 𝛽 1 𝐸 𝑋 = න 𝑓 𝑥 ∙ 𝑥 𝑑𝑥 = න ∙ 𝑥 𝑑𝑥 𝛼 𝛼 𝛽−𝛼 積分公式 𝛽 2 𝛽 𝑥 න 𝑥 𝑑𝑥 = 2 𝛼 1 𝑥2 = ∙ 𝛽−𝛼 2 𝛽 𝛼 𝛼 259
確率密度関数と期待値 一様分布の期待値計算の詳細 𝛽 𝛽 1 𝐸 𝑋 = න 𝑓 𝑥 ∙ 𝑥 𝑑𝑥 = න ∙ 𝑥 𝑑𝑥 𝛼 𝛼 𝛽−𝛼 1 𝑥2 = ∙ 𝛽−𝛼 2 𝛽 𝛼 𝛽2 − 𝛼 2 = 2 𝛽−𝛼 展開公式 𝛽2 − 𝛼 2 = 𝛽 − 𝛼 𝛽 + 𝛼 𝛽−𝛼 𝛽+𝛼 = 2 𝛽−𝛼 260
確率密度関数と期待値 一様分布の期待値計算の詳細 𝛽 𝛽 1 𝐸 𝑋 = න 𝑓 𝑥 ∙ 𝑥 𝑑𝑥 = න ∙ 𝑥 𝑑𝑥 𝛼 𝛼 𝛽−𝛼 1 𝑥2 = ∙ 𝛽−𝛼 2 𝛽 𝛼 𝛽2 − 𝛼 2 = 2 𝛽−𝛼 𝛽−𝛼 𝛽+𝛼 = 2 𝛽−𝛼 𝛽+𝛼 = 2 261
確率変数の分散 262
内容 1.確率変数の分散とは 2.分散の計算例 263
内容 1.確率変数の分散とは 2.分散の計算例 264
確率変数の分散とは 「確率変数の分散」の直感的な説明 「確率変数が、期待値から どれだけ離れていると期待できるか」を表した指標 「確率変数の分散」の計算 確率変数𝑋の期待値を𝐸 𝑋 と表記する 分散を𝑉 𝑋 と表記すると 𝑉 𝑋 は以下のように定義される 𝑉 𝑋 =𝐸 𝑋−𝐸 𝑋 2 確率変数𝑋とその期待値𝐸 𝑋 の差異 265
確率変数の分散とは 「確率変数の分散」の直感的な説明 「確率変数が、期待値から どれだけ離れていると期待できるか」を表した指標 「確率変数の分散」の計算 確率変数𝑋の期待値を𝐸 𝑋 と表記する 分散を𝑉 𝑋 と表記すると 𝑉 𝑋 は以下のように定義される 𝑉 𝑋 =𝐸 𝑋−𝐸 𝑋 2 差異 𝑋 − 𝐸 𝑋 期待値 2 の 確率変数𝑋とその期待値𝐸 𝑋 の差異 266
確率変数の分散とは 確率変数の分散の計算 以下のように計算される 分散=「確率変数-期待値」の2乗に対する期待値 離散型の確率変数における分散の計算 確率変数を𝑋とし、実現値を𝑥1 , 𝑥2 , … , 𝑥𝑛 とする 確率質量関数を𝑓 𝑥𝑖 とする。期待値を𝜇と表記する 𝑛 𝑉 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 − 𝜇 2 𝑖=1 (連続型の確率変数を相手にする場合は積分する) 267
確率変数の分散とは 確率変数を𝑋とし、実現値を𝑥1 , 𝑥2 , … , 𝑥𝑛 とする 確率質量関数を𝑓 𝑥𝑖 とする。期待値を𝜇と表記する 確率変数の期待値 𝑛 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 確率変数の分散 𝑛 𝑉 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 − 𝜇 2 𝑖=1 268
確率変数の分散とは 確率変数を𝑋とし、実現値を𝑥1 , 𝑥2 , … , 𝑥𝑛 とする 確率質量関数を𝑓 𝑥𝑖 とする。期待値を𝜇と表記する 確率変数の期待値 𝑛 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 期待値と分散の 対応関係に注目 確率変数の分散 𝑛 𝑉 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 − 𝜇 2 𝑖=1 269
内容 1.確率変数の分散とは 2.分散の計算例 270
𝑛 クイズ 𝑉 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 − 𝜇 𝑖=1 2 𝑛 確率質量関数の分散 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 確率変数を𝑋とする。値域は 1,2 。 𝑖=1 実現値を𝑥1 = 1, 𝑥2 = 2 とする。 このときの確率質量関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 確率変数𝑋の期待値𝜇 = 1.8である。 この時、分散𝑉 𝑋 を求めよ ① 𝟎. 𝟏𝟔 ② 𝟏. 𝟔 ③ 𝟏𝟔 ④ 𝟏𝟔𝟎
𝑛 クイズ(回答) 𝑉 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 − 𝜇 𝑖=1 2 𝑛 確率質量関数の分散 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 確率変数を𝑋とする。値域は 1,2 。 𝑖=1 実現値を𝑥1 = 1, 𝑥2 = 2 とする。 このときの確率質量関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 確率変数𝑋の期待値𝜇 = 1.8である。 この時、分散𝑉 𝑋 を求めよ ① 𝟎. 𝟏𝟔 ② 𝟏. 𝟔 ③ 𝟏𝟔 ④ 𝟏𝟔𝟎
𝑛 クイズ(回答) 𝑉 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 − 𝜇 𝑖=1 2 𝑛 確率質量関数の分散 𝐸 𝑋 = 𝑓 𝑥𝑖 ∙ 𝑥𝑖 確率変数を𝑋とする。値域は 1,2 。 𝑖=1 実現値を𝑥1 = 1, 𝑥2 = 2 とする。 このときの確率質量関数𝑓 𝑥𝑖 を以下とする 𝑓 𝑥𝑖 = 0.2 × 𝑥𝑖2 確率変数𝑋の期待値𝜇 = 1.8である。 この時、分散𝑉 𝑋 を求めよ 𝑉 𝑋 = 𝑓 𝑥1 ∙ 𝑥1 − 𝜇 2 + 𝑓 𝑥2 ∙ 𝑥2 − 𝜇 = 0.2 × 1 − 1.8 2 + 0.8 × 2 − 1.8 = 0.2 × −0.8 2 + 0.8 × 0.2 = 0.2 × 0.64 + 0.8 × 0.04 2 2 2 = 0. 128 + 0.032 = 0. 16
統計学 I 第12回:代表的な確率分布
内容 1.前回の復習 2.二項分布 3.正規分布 275
前回の復習 276
二項分布 277
内容 1.二項分布とは 2.二項分布の使い道 3.二項分布の応用 278
内容 1.二項分布とは 2.二項分布の使い道 3.二項分布の応用 279
二項分布 二項分布とは 確率分布の1種。一様分布のようにパラメータを持つ →パラメータを変えることで、様々な確率分布を作れる 二項分布の確率質量関数 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 確率変数は0以上𝑛以下の整数を取りうる →𝑛 = 100だと、101通り これを数表で示すのは大変なので、確率質量関数を使う 280
二項分布 二項分布のパラメータの意味 表が出る確率が𝜃であるコインを𝑛回投げた時、 𝑋回の表が出る確率 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 二項分布の確率質量関数から確率を計算するのは大変 多くの場合は、コンピュータを利用する (この数式を実際に使って計算する演習は出ない) 今回のテーマ なぜこのような複雑な確率質量関数を持つ 確率分布が「必要とされる」のだろうか 281
二項分布の補足 n :コインを投げた回数 x :表が出た回数 θ :表が出る確率 二項分布 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 本来は『 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 』という長い数式だが、 毎回これを書くのが面倒なので今後はBin()と省略 282
二項分布の補足 n :コインを投げた回数 x :表が出た回数 θ :表が出る確率 二項分布 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 縦棒『|』の右側が“条件”を表す 283
二項分布の補足 n :コインを投げた回数 x :表が出た回数 θ :表が出る確率 二項分布 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 表が出る確率が𝜃であるコインを𝑛回投げた時(ここまで条件) 「𝑋枚のコインが表になる」という結果が得られる確率 →この確率を計算する式こそが 二項分布の確率質量関数『Bin 𝑋 𝑛, 𝜃 』 284
二項分布の補足 n :コインを投げた回数 x :表が出た回数 θ :表が出る確率 二項分布 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 場合の数 裏がn-x回 出る確率 表がx回 出る確率 285
二項分布の補足 n :コインを投げた回数 x :表が出た回数 θ :表が出る確率 二項分布 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 コインを2回投げて、2回とも表になる確率 𝜃×𝜃 コインを3回投げて、3回とも表になる確率 𝜃×𝜃×𝜃 コインをn回投げて、x回とも表になる確率 𝜃𝑥 コインをn回投げて、n-x回が裏になる確率 1−𝜃 𝑛−𝑥 286
二項分布の補足 n :コインを投げた回数 x :表が出た回数 θ :表が出る確率 二項分布 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 4回コインを投げて(n=4)、2回表が出る時(x=2) パターン1:表・表・裏・裏 パターン4:裏・表・表・裏 パターン2:表・裏・表・裏 パターン5:裏・表・裏・表 パターン3:表・裏・裏・表 パターン6:裏・裏・表・表 𝑛! パターンの数: 𝑛C𝑥 = 𝑛 − 𝑥 ! ∙ 𝑥! 287
二項分布 二項分布に従う確率変数の期待値と分散 表が出る確率が𝜃であるコインを𝑛回投げた時、 𝑋回の表が出る確率 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 期待値 𝐸 𝑋 = 𝑛𝜃 分散 𝑉 𝑋 = 𝑛𝜃 1 − 𝜃 証明は少し難しいので省略 (興味のある学生は https://logics-of-blue.com/stats-calc-note/ )
内容 1.二項分布とは 2.二項分布の使い道 3.二項分布の応用 289
二項分布 この確率計算できますか? 2分の1で表が出るコインを1回投げて、表が1回出る確率 →これは2分の1 →𝜃 = 1Τ2 , 𝑛 = 1を代入した二項分布で𝑋 = 1の確率を計算 10分の3で表が出るコインを10回投げて、表が2回出る確率 →これは計算が難しい…… →𝜃 = 3Τ10 , 𝑛 = 10を代入した二項分布で𝑋 = 2の確率を計算 290
二項分布 表が出る回数 0 1 2 3 4 5 6 7 8 9 10 その確率 0.028 0.121 0.233 0.267 0.200 0.103 0.037 0.009 0.001 0.000 0.000 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 3 Bin 𝑋 10, 10 上記の二項分布において、 確率を数表で整理 (小数点以下第4位で四捨五入) 291
二項分布 表が出る回数 0 1 2 3 4 5 6 7 8 9 10 その確率 0.028 0.121 0.233 0.267 0.200 0.103 0.037 0.009 0.001 0.000 0.000 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 3 Bin 𝑋 10, 10 上記の二項分布において、 確率を数表で整理 (小数点以下第4位で四捨五入) 表が2回出る確率は およそ23.3% 292
二項分布 表が出る回数 0 1 2 3 4 5 6 7 8 9 10 その確率 0.028 0.121 0.233 0.267 0.200 0.103 0.037 0.009 0.001 0.000 0.000 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 3 Bin 𝑋 10, 10 上記の二項分布において、 確率を数表で整理 (小数点以下第4位で四捨五入) 表が3回出る確率が 一番高い 293
二項分布 表が出る回数 0 1 2 3 4 5 6 7 8 9 10 その確率 0.028 0.121 0.233 0.267 0.200 0.103 0.037 0.009 0.001 0.000 0.000 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 3 Bin 𝑋 10, 10 上記の二項分布において、 確率を数表で整理 (小数点以下第4位で四捨五入) 一度も表が出ない という可能性も2.8% 294
二項分布 表が出る回数 0 1 2 3 4 5 6 7 8 9 10 その確率 0.028 0.121 0.233 0.267 0.200 0.103 0.037 0.009 0.001 0.000 0.000 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 3 Bin 𝑋 10, 10 上記の二項分布において、 確率を数表で整理 (小数点以下第4位で四捨五入) 9回以上表になる確率は 0に近い 確率はとても小さいが、0ではない 295
二項分布 Bin 𝑋 10,0.3 = 10C𝑥 ∙ 0.3𝑥 ∙ 1 − 0.3 10−𝑥 表が出る その確率 回数 0 0.028 1 0.121 2 0.233 3 0.267 4 0.200 5 0.103 6 0.037 7 0.009 8 0.001 9 0.000 10 0.000 以外? 納得? この確率を簡単に計算するのが二項分布 296
二項分布 Bin 𝑋 10,0.3 = 10C𝑥 ∙ 0.3𝑥 ∙ 1 − 0.3 10−𝑥 表が出る その確率 回数 0 0.028 1 0.121 2 0.233 3 0.267 4 0.200 5 0.103 6 0.037 7 0.009 8 0.001 9 0.000 10 0.000 確率分布は、グラフで表すことも多い 297
内容 1.二項分布とは 2.二項分布の使い道 3.二項分布の応用 298
二項分布 パラメータを変えると、様々な確率分布を作れる 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 𝜃 = 1Τ10 , 𝑛 = 10の二項分布 𝜃 = 7Τ10 , 𝑛 = 10の二項分布 299
二項分布 パラメータを変えると、様々な確率分布を作れる 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 𝜃 = 1Τ10 , 𝑛 = 10の二項分布 𝜃 = 7Τ10 , 𝑛 = 10の二項分布 「1回だけ表」 になりやすい 300
二項分布 パラメータを変えると、様々な確率分布を作れる 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 𝜃 = 1Τ10 , 𝑛 = 10の二項分布 𝜃 = 7Τ10 , 𝑛 = 10の二項分布 「7回だけ表」 になりやすい 301
二項分布 コイン投げ以外でも様々な確率的な変化を表現できる 表が出る確率が𝜃であるコインを𝑛回投げた時、 𝑋回の表が出る確率 →コイン投げ以外でも確率的な変化が同じことがありうる 例) くじ引き ガチャ 302
二項分布 くじ引きで、何回あたりが出る? (くじ引きの場合) 当たり率が10分の3であるくじがある このくじを10回引いたとき、2回当たりが出る確率は? (コイン投げの場合) 10分の3の確率で表が出るコインを10回投げて 2回表が出る確率は? →表が出る回数は、𝜃 = 0.3, 𝑛 = 10の二項分布に従う (くじ引きの場合) →当たりが出る回数は、𝜃 = 0.3, 𝑛 = 10の二項分布に従う 303
二項分布 表が出る回数 0 1 2 3 4 5 6 7 8 9 10 その確率 0.028 0.121 0.233 0.267 0.200 0.103 0.037 0.009 0.001 0.000 0.000 𝜃 = 3Τ10 , 𝑛 = 10の二項分布 3 Bin 𝑋 10, 10 上記の二項分布において、 確率を数表で整理 (小数点以下第4位で四捨五入) コイン投げ 表が2回出る確率は およそ23.3% くじ引き 2回当たる確率は およそ23.3% 304
クイズ 二項分布 SSR(当たり)が出る確率が2%(0.02)のガチャがある このガチャを100回回して1度も当たりが出ない確率を求める 二項分布におけるパラメータはどのように設定したら良い? 参考:コイン投げの場合 表が出る確率が𝜃であるコインを𝑛回投げた時、 𝑋回の表が出る確率 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 ① 𝜃 = 100 𝑛 = 0.02 ② 𝜃 = 0.02 𝑛 = 100 ③ 𝜃=1 𝑛 = 100 ④ 𝜃 = 0.02 𝑛=1
クイズ(回答) 二項分布 SSR(当たり)が出る確率が2%(0.02)のガチャがある このガチャを100回回して1度も当たりが出ない確率を求める 二項分布におけるパラメータはどのように設定したら良い? 参考:コイン投げの場合 表が出る確率が𝜃であるコインを𝑛回投げた時、 𝑋回の表が出る確率 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 ① 𝜃 = 100 𝑛 = 0.02 ② 𝜃 = 0.02 𝑛 = 100 ③ 𝜃=1 𝑛 = 100 ④ 𝜃 = 0.02 𝑛=1
クイズ(回答) 二項分布 SSR(当たり)が出る確率が2%(0.02)のガチャがある このガチャを100回回して1度も当たりが出ない確率を求める 二項分布におけるパラメータはどのように設定したら良い? ② 𝜃 = 0.02 𝑛 = 100 参考:コイン投げの場合 表が出る確率が𝜃であるコインを𝑛回投げた時、 𝑋回の表が出る確率 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥 ガチャの場合 SSR排出率が𝜃であるガチャを𝑛回実行した時、 𝑋回の当たりキャラが出る確率 Bin 𝑋 𝑛, 𝜃 = 𝑛C𝑥 ∙ 𝜃 𝑥 ∙ 1 − 𝜃 𝑛−𝑥
正規分布 308
内容 1.正規分布とは 2.正規分布の成り立ち 3.正規分布の使い方 309
内容 1.正規分布とは 2.正規分布の成り立ち 3.正規分布の使い方 310
正規分布 正規分布とは 確率分布の1種。一様分布のようにパラメータを持っている →パラメータを変えることで、様々な確率分布を作れる →「正規」は「一般的」くらいの意味(「正しい」では無い) 正規分布の確率密度関数 Normal 𝑋 𝜇, 𝜎 2 = 1 2𝜋𝜎 2 𝑒 𝑥−𝜇 2 − 2𝜎 2 確率変数は−∞から∞までの実数を取りうる →正規分布は連続型の確率変数の従う確率分布 311
正規分布 正規分布のパラメータの意味 平均(期待値)が𝜇、分散が𝜎 2 、標準偏差が𝜎となるので パラメータの意味が理解しやすい Normal 𝑋 𝜇, 𝜎 2 = 1 2𝜋𝜎 2 𝑒 𝑥−𝜇 2 − 2𝜎 2 (この数式を実際に使って計算する演習は出ない) 今回のテーマ なぜこのような複雑な確率密度関数を持つ 確率分布が「必要とされる」のだろうか 312
正規分布 Normal 𝑋 𝜇, 𝜎 2 = 1 2𝜋𝜎 2 𝑒 𝑥−𝜇 2 − 2𝜎 2 正規分布はグラフで表現することが多い 連続型の確率変数が従う確率分布なので、数表にしにくい 313
正規分布 Normal 𝑋 𝜇, 𝜎 正規分布のグラフの特徴① 2 = 1 2𝜋𝜎 2 𝑒 𝑥−𝜇 2 − 2𝜎 2 「釣り鐘型」や「ベル 型」と呼ぶこともある 平均に対して左右対称 平均値𝜇に対して 左右対称 314
正規分布 正規分布のグラフの特徴① 平均に対して左右対称 黒線:平均0 赤線:平均2 (分散は1) 315
正規分布 ベル型で「平均値に対して左右対称」ってどういう意味? 平均値よりも「2」大きな結果も「2」小さな結果も、 同じくらい起こりやすい (ようするに) 「上振れ」「下振れ」問わず、 「平均値から離れる」と、発生確率が下がる 316
正規分布 正規分布のグラフの特徴② 分散の大きさで裾の広さが変わる 黒線:分散1 赤線:分散4 (平均は0) 裾が狭い(黒線) 裾が広い(赤線) 317
正規分布 「裾が狭い・広い」ってどういう意味? 裾が狭い(分散が小さい)なら、 「平均値の近くは、発生確率が高い」 「平均値から離れると、急速に発生確率が下がる」 →平均値に近い結果が出やすいと予想できる(ばらつき小) 裾が狭い(黒線) 318
正規分布 「裾が狭い・広い」ってどういう意味? 裾が広い(分散が大きい)なら、 「平均値の近くであっても、平均値から離れいても 同じくらい発生確率が低い」 →どこも発生確率が低い →どのような結果が起こるか予想がつきにくい(ばらつき大) 裾が広い(赤線) 319
内容 1.正規分布とは 2.正規分布の成り立ち 3.正規分布の使い方 320
正規分布 魚の体長の変化の仕方 魚の体長を確率変数だと考える 「魚の体長が正規分布に従っている」という場合、 魚の体長はどのように変化して、 どのように分布していると考えられるだろうか 321
正規分布 仮定①:魚の「標準的な大きさ」は決まっている コイツが標準的な大きさの魚 仮定②:小さな変化の積み重ねで体長が変化 食べ物の多い・少ない 気温の高い・低い 雨量の多い・少ない 小さな変化の積み重ねは何をもたらすか? 322
正規分布 小 標準 大 たまたま食べ物が多かった ちょっとだけ大きくなる 323
正規分布 小 標準 大 たまたま気温が低かった 標準体長に戻る 正負の影響が混ざって、元に戻る 324
正規分布 小 標準 ×食べ物、×気温 (アンラッキー) 大 ○食べ物、○気温 (ラッキー) 極端な結果にはなりにくいはず 325
正規分布 1.体長は小さな誤差の積み重ねで決まると仮定 2.小さな誤差は、正負共に50%の確率で加わると仮定 ほかにもいくつかの導出がある 1 2 1 4 標準 1 2 1 2 1 4 326
体長のヒストグラム 正規分布 1 2 1 4 標準 1 2 1 2 1 4 標準体長になる確率が最も高い 極端な体長になる確率は低い 327
正規分布 体長のヒストグラム 左右対称のベル型 328
正規分布 小さな変化の積み重ねで体長が変化 1 2 標準 1 4 1 2 1 2 1 4 正規分布の確率密度関数 Normal 𝑋 𝜇, 𝜎 2 = 1 2𝜋𝜎 2 𝑒 𝑥−𝜇 2 − 2𝜎 2 使い勝手が良いので、頻繁に登場する 329
内容 1.正規分布とは 2.正規分布の成り立ち 3.正規分布の使い方 330
正規分布 確率密度から確率を計算する方法 確率密度関数の下側の面積が確率になる 面積1に標準化されたヒストグラムと似たような扱い 積分計算によって求められる 𝑏 𝑏 𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = න 𝑓 𝑥 𝑑𝑥 = න 𝑎 𝑎 1 2𝜋𝜎 2 𝑒 𝑥−𝜇 2 − 2𝜎 2 𝑑𝑥 正規分布の積分計算はとても難しい →正規分布の便利な性質を利用 331
𝑃 𝜇 − 1.96𝜎 ≤ 𝑋 ≤ 𝜇 + 1.96𝜎 ≈ 0.95 正規分布 正規分布の便利な性質 平均𝜇、標準偏差𝜎、平均に対して左右対称であることに注意 平均から1.96𝜎だけ離れた範囲の面積がおよそ95%となる −1.96 1.96 この範囲の 面積が0.95 332
クイズ 𝑃 𝜇 − 1.96𝜎 ≤ 𝑋 ≤ 𝜇 + 1.96𝜎 ≈ 0.95 正規分布の95%区間 平均𝜇 = 1、標準偏差𝜎 = 2の正規分布がある 上記の正規分布に従う確率変数において、 その95%が収まる範囲を答えよ (ヒント) 平均から1.96𝜎だけ離れた範囲の面積がおよそ95%となる ① −1.96から 1.96の間 ② −3.92から 3.92の間 ③ −2.92から 4.92の間 ④ −0.96から 2.96の間
クイズ(回答) 𝑃 𝜇 − 1.96𝜎 ≤ 𝑋 ≤ 𝜇 + 1.96𝜎 ≈ 0.95 正規分布の95%区間 平均𝜇 = 1、標準偏差𝜎 = 2の正規分布がある 上記の正規分布に従う確率変数において、 その95%が収まる範囲を答えよ (ヒント) 平均から1.96𝜎だけ離れた範囲の面積がおよそ95%となる ① −1.96から 1.96の間 ② −3.92から 3.92の間 ③ −2.92から 4.92の間 ④ −0.96から 2.96の間
クイズ(回答) 𝑃 𝜇 − 1.96𝜎 ≤ 𝑋 ≤ 𝜇 + 1.96𝜎 ≈ 0.95 正規分布の95%区間 平均𝜇 = 1、標準偏差𝜎 = 2の正規分布がある 上記の正規分布に従う確率変数において、 その95%が収まる範囲を答えよ (ヒント) 平均から1.96𝜎だけ離れた範囲の面積がおよそ95%となる 𝑃 𝜇 − 1.96𝜎 ≤ 𝑋 ≤ 𝜇 + 1.96𝜎 ≈ 0.95 𝑃 1 − 1.96 × 2 ≤ 𝑋 ≤ 1 + 1.96 × 2 ≈ 0.95 𝑃 1 − 3.92 ≤ 𝑋 ≤ 1 + 3.92 ≈ 0.95 𝑃 −2.92 ≤ 𝑋 ≤ 4.92 ≈ 0.95 ③ −2.92から 4.92の間
クイズ(回答) 𝑃 𝜇 − 1.96𝜎 ≤ 𝑋 ≤ 𝜇 + 1.96𝜎 ≈ 0.95 正規分布の95%区間 平均𝜇 = 1、標準偏差𝜎 = 2の正規分布 −2.92 ③ −2.92から 4.92の間 4.92 この範囲の面積が0.95
クイズ 𝑃 𝜇 − 1.96𝜎 ≤ 𝑋 ≤ 𝜇 + 1.96𝜎 ≈ 0.95 正規分布の95%区間 正規分布に従う確率変数において、 その95%が収まる範囲の性質を答えよ。 標準偏差𝜎が大きくなると、 正規分布に従う確率変数の95%が収まる範囲はどうなる? ① 幅が広くなる ② 幅が狭くなる ③ 範囲は変わらない
クイズ(回答) 𝑃 𝜇 − 1.96𝜎 ≤ 𝑋 ≤ 𝜇 + 1.96𝜎 ≈ 0.95 正規分布の95%区間 正規分布に従う確率変数において、 その95%が収まる範囲の性質を答えよ。 標準偏差𝜎が大きくなると、 正規分布に従う確率変数の95%が収まる範囲はどうなる? ① 幅が広くなる ② 幅が狭くなる ③ 範囲は変わらない
正規分布 正規分布のグラフの特徴② 分散の大きさで裾の広さが変わる 裾が狭い(黒線) 黒線:分散1 赤線:分散4 (平均は0) 裾が広い(赤線) 339
正規分布 正規分布のグラフの特徴② 分散の大きさで裾の広さが変わる 分散1(標準偏差1)なら この範囲の面積が0.95 黒線:分散1 赤線:分散4 (平均は0) 340
正規分布 正規分布のグラフの特徴② 分散の大きさで裾の広さが変わる 分散4(標準偏差2)なら この範囲の面積が0.95 黒線:分散1 赤線:分散4 (平均は0) 341
統計学 I 第13回:多次元確率分布の基礎
内容 1.同時分布と周辺分布 2.確率変数の和の期待値 3.条件付き分布と独立 343
同時分布と周辺分布 344
多次元確率分布の基礎 多次元確率分布 2つ以上の確率変数を対象とした確率分布のこと 2つ以上ならいくつでも良い 2次元確率分布 「2つだけ」の確率変数を対象とした確率分布のこと (次元が増えると難しいので、今回の講義では2次元まで) (離散型・連続型のどちらの確率変数にも対応するが、 連続型は難しいので、今回の講義では離散型のみを扱う →2次元離散型確率変数) 345
多次元確率分布の基礎 同時確率分布(同時分布・結合分布とも呼ぶ) 2つの確率変数の「組み合わせ」の確率分布 「すべての組み合わせ」の確率を合計すると1になる 同時確率分布= 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 かつ、 𝑌 = 𝑦𝑗 である確率の分布 346
多次元確率分布の基礎 同時確率分布の例:コイン投げとサイコロ投げの組み合わせ コイン投げの結果という確率変数を𝑋とする サイコロ投げの結果という確率変数を𝑌とする コイン投げ(1次元の確率分布) 𝑃 𝑋 = 0 = 1Τ2 , 𝑃 𝑋 = 1 = 1Τ2 →足すと1 サイコロ投げ(1次元の確率分布) 𝑃 𝑌 = 1 = 1Τ6 , 𝑃 𝑌 = 2 = 1Τ6 , 𝑃 𝑌 = 3 = 1Τ6 , 𝑃 𝑌 = 4 = 1Τ6 , 𝑃 𝑌 = 5 = 1Τ6 , 𝑃 𝑌 = 6 = 1Τ6 →足すと1 347
多次元確率分布の基礎 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) コイン投げ 𝑋 0 1 1 1 12 1 12 サイコロ投げ 𝑌 2 3 4 5 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 6 1 12 1 12 12パターンの組み合わせの 「同時確率」を足すと1になる 348
多次元確率分布の基礎 同時確率分布(同時分布・結合分布とも呼ぶ) 2つの確率変数の「組み合わせ」の確率分布 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑖 = 1,2, … , 𝑚; 𝑗 = 1,2, … , 𝑛 「すべての組み合わせ」の確率を合計すると1になる 𝑚 𝑛 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 1 𝑖=1 𝑗=1 349
多次元確率分布の基礎 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) コイン投げ 𝑋 0 1 1 1 12 1 12 2行(𝑚 = 2)、6列(𝑛 = 6)の すべてを合計する サイコロ投げ 𝑌 2 3 4 5 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 𝑚 6 1 12 1 12 𝑛 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 1 𝑖=1 𝑗=1 350
多次元確率分布の基礎 周辺確率分布(周辺分布とも呼ぶ) 「組み合わせ」である2次元の同時確率分布を、 「もともとの1次元の確率分布に戻したもの」 というイメージ →周辺分布は、個別に合計が1になる 「元の確率分布」あるいは「1次元の分布」 が知りたい場合は、周辺分布を見る! 351
多次元確率分布の基礎 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 合計 1 2 1 2 1 352
多次元確率分布の基礎 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 合計 1 2 1 2 1 行ごとに合計を取ると、 コイン投げの(1次元の)確率分布が再現できる 353
多次元確率分布の基礎 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 列ごとに合計を取ると、 サイコロの(1次元の)確率分布が再現できる 合計 1 2 1 2 1 354
多次元確率分布の基礎 周辺確率分布(周辺分布とも呼ぶ) 「組み合わせ」である2次元の同時確率分布を、 「もともとの1次元の確率分布に戻したもの」 というイメージ 𝑛 𝑃 𝑋 = 𝑥𝑖 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑗=1 𝑚 𝑃 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑖=1 「相手」を変えて、 同時分布を合計する 355
多次元確率分布の基礎 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 合計 1 2 1 2 1 相手(サイコロの出目)を6通り変化させて 同時分布を合計すると、コインの周辺分布が得られる 356
多次元確率分布の基礎 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 合計 1 2 1 2 1 相手(コインの結果)を2通り変化させて 同時分布を合計すると、サイコロの周辺分布が得られる 357
クイズ 同時分布 確率変数𝑋, 𝑌の同時分布の表において「?」の確率を答えよ 0 確率変数𝑋 1 𝟏 ① 𝟐 𝟏 ② 𝟑 確率変数 𝑌 1 2 3 1 0 0 3 1 ? 0 2 𝟏 ③ 𝟔 ④ 𝟎
クイズ(回答) 同時分布 確率変数𝑋, 𝑌の同時分布の表において「?」の確率を答えよ 0 確率変数𝑋 同時分布は、 すべて合計すると1になる 𝟏 ① 𝟐 𝟏 ② 𝟑 1 確率変数 𝑌 1 2 3 1 0 0 3 1 ? 0 2 𝟏 ③ 𝟔 ④ 𝟎
クイズ 周辺分布 同時分布の表において、𝑋の周辺分布を答えよ 確率変数 𝑋 0 1 ① 𝑃 𝑋 = 0 = 1Τ2 𝑃 𝑋 = 1 = 1Τ2 1 1 3 0 確率変数 2 3 𝑌 合計 0 0 𝑃 𝑋=0 1 2 1 6 𝑃 𝑋=1 ② 𝑃 𝑋 = 0 = 1Τ3 𝑃 𝑋 = 1 = 2Τ3 ③ 𝑃 𝑋=0 =0 𝑃 𝑋=1 =1
クイズ(回答) 周辺分布 同時分布の表において、𝑋の周辺分布を答えよ 確率変数 𝑋 0 1 ① 𝑃 𝑋 = 0 = 1Τ2 𝑃 𝑋 = 1 = 1Τ2 1 1 3 0 確率変数 2 3 𝑌 合計 0 0 𝑃 𝑋=0 1 2 1 6 𝑃 𝑋=1 ② 𝑃 𝑋 = 0 = 1Τ3 𝑃 𝑋 = 1 = 2Τ3 ③ 𝑃 𝑋=0 =0 𝑃 𝑋=1 =1
② 𝑃 𝑋 = 0 = 1Τ3 𝑃 𝑋 = 1 = 2Τ3 クイズ(回答) 周辺分布 同時分布の表において、𝑋の周辺分布を答えよ 0 1 1 3 確率変数 2 3 0 0 確率変数 𝑋 1 1 1 0 行の合計は1Τ3 + 0 + 0 = 1 2Τ3 6 よって𝑃 𝑋 = 0 = 1Τ3 𝑌 合計 𝑃 𝑋=0 𝑃 𝑋=1
② 𝑃 𝑋 = 0 = 1Τ3 𝑃 𝑋 = 1 = 2Τ3 クイズ(回答) 周辺分布 同時分布の表において、𝑋の周辺分布を答えよ 確率変数 𝑋 0 1 1 1 3 0 確率変数 2 3 𝑌 合計 0 0 𝑃 𝑋=0 1 2 1 6 𝑃 𝑋=1 行の合計は0 + 1Τ2 + 1Τ6 = 2Τ3 よって𝑃 𝑋 = 1 = 2Τ3
クイズ 周辺分布 同時分布の表において、𝑌の周辺分布を答えよ 0 確率変数 𝑋 1 1 1 3 0 合計 𝑃 𝑌 = 1 ① 𝑃 𝑌 = 1 = 1Τ3 𝑃 𝑌 = 2 = 1Τ2 𝑃 𝑌 = 3 = 1Τ6 確率変数 2 𝑌 3 0 0 1 2 𝑃 𝑌=2 1 6 𝑃 𝑌=3 ② 𝑃 𝑌 = 1 = 1Τ3 𝑃 𝑌 = 2 = 1Τ3 𝑃 𝑌 = 3 = 1Τ3 合計 1 3 2 3 1 ③ 𝑃 𝑌 = 1 = 1Τ2 𝑃 𝑌 = 2 = 1Τ2 𝑃 𝑌 = 3 = 1Τ2
クイズ(回答) 周辺分布 同時分布の表において、𝑌の周辺分布を答えよ 0 確率変数 𝑋 1 1 1 3 0 合計 𝑃 𝑌 = 1 ① 𝑃 𝑌 = 1 = 1Τ3 𝑃 𝑌 = 2 = 1Τ2 𝑃 𝑌 = 3 = 1Τ6 確率変数 2 𝑌 3 0 0 1 2 𝑃 𝑌=2 1 6 𝑃 𝑌=3 ② 𝑃 𝑌 = 1 = 1Τ3 𝑃 𝑌 = 2 = 1Τ3 𝑃 𝑌 = 3 = 1Τ3 合計 1 3 2 3 1 ③ 𝑃 𝑌 = 1 = 1Τ2 𝑃 𝑌 = 2 = 1Τ2 𝑃 𝑌 = 3 = 1Τ2
クイズ(回答) これで完成 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 確率変数 2 𝑌 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1
確率変数の和の期待値 367
内容 1.期待値の復習(1次元の確率分布) 2.2次元確率分布の和の期待値 3.和の期待値についての便利な公式 368
内容 1.期待値の復習(1次元の確率分布) 2.2次元確率分布の和の期待値 3.和の期待値についての便利な公式 369
確率変数の和の期待値 期待値の定義 確率変数において、以下で計算される値のこと 期待値=「確率×その時の値」の合計 (連続型の確率変数を相手にする場合は積分する) 期待値の表記法 確率変数𝑋の期待値を𝐸 𝑋 と表記する (確率変数が𝑌なら、期待値は𝐸 𝑌 と表記される) 期待値は短く𝜇と表記することもある 370
確率変数の和の期待値 期待値の計算例 コイン投げ結果という確率変数に対して、期待値を計算 コイン投げの確率分布 結果 2 3 確率 1 2 1 2 期待値=「確率×その時の値」の合計 1 1 5 = ×2+ ×3 = 2 2 2 371
内容 1.期待値の復習(1次元の確率分布) 2.2次元確率分布の和の期待値 3.和の期待値についての便利な公式 372
確率変数の和の期待値 コイン投げとサイコロ投げの同時分布 コイン投げ 𝑋 0 1 1 1 12 1 12 サイコロ投げ 𝑌 2 3 4 5 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 6 1 12 1 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
確率変数の和の期待値 コイン投げとサイコロ投げの同時分布 サイコロ投げ 𝑌 1 2 3 4 5 1 1 1 1 1 0 コイン投げ 12 12 12 12 12 𝑋 1 1 1 1 1 1 「確率の表」と「合計値の表」の 12 12 12 12 12 すべてのマス目を掛け算した結果を合計する 6 1 12 1 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
確率変数の和の期待値 和の期待値の計算(同時分布はすべて「12分の1」なのを利用) 1+2+3+4+5+6 + 2+3+4+5+6+7 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
確率変数の和の期待値 和の期待値の計算(同時分布はすべて「12分の1」なのを利用) 1行目 2行目 1+2+3+4+5+6 + 2+3+4+5+6+7 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
確率変数の和の期待値 和の期待値の計算(同時分布はすべて「12分の1」なのを利用) 1+2+3+4+5+6 + 2+3+4+5+6+7 12 21 + 27 48 = = =4 和の期待値は「4」 12 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
クイズ ヒント 確率変数の和 確率変数の和の期待値 𝑋 𝑋 + 𝑌の期待値を答えよ 0 確率変数𝑋 1 𝟏 ① 𝟑 𝟏 ② 𝟐 0 1 1 𝑌 2 1 2 2 3 確率変数 𝑌 1 2 3 1 0 0 3 1 1 0 6 2 𝟓 ③ 𝟐 𝟓 ④ 𝟑 3 3 4
クイズ(回答) ヒント 確率変数の和 確率変数の和の期待値 𝑋 𝑋 + 𝑌の期待値を答えよ 0 確率変数𝑋 1 𝟏 ① 𝟑 𝟏 ② 𝟐 0 1 1 𝑌 2 1 2 2 3 確率変数 𝑌 1 2 3 1 0 0 3 1 1 0 6 2 𝟓 ③ 𝟐 𝟓 ④ 𝟑 3 3 4
クイズ(回答) 同時分布 0 𝑋 1 確率変数の和 1 1 3 0 𝑌 2 3 0 0 1 2 1 6 𝑋 0 1 1 𝑌 2 1 2 2 3 「確率の表」と「合計値の表」の すべてのマス目を掛け算した結果を合計する (確率が0のマス目は無視してOK →0に何をかけても結果は0なので) 3 3 4
クイズ(回答) 同時分布 0 𝑋 1 確率変数の和 1 1 3 0 𝑌 2 3 0 0 1 2 1 6 1 1 1 𝐸 𝑋+𝑌 = ×1+ ×3+ ×4 3 2 6 1 3 4 = + + 3 2 6 2 9 4 = + + 6 6 6 𝑋 0 1 15 = 6 5 = 2 1 𝑌 2 1 2 2 3 3 3 4
内容 1.期待値の復習(1次元の確率分布) 2.2次元確率分布の和の期待値 3.和の期待値についての便利な公式 382
確率変数の和の期待値 和の期待値における便利な公式 確率変数𝑋, 𝑌において、以下が成り立つ 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 前期の講義における最重要公式の1つ 383
事例1:コイン投げとサイコロ投げ 1. 期待値を個別に求めて合計 2. 定義通りに和の期待値を計算
事例1:コイン投げとサイコロ投げ 1. 期待値を個別に求めて合計 2. 定義通りに和の期待値を計算
多次元確率分布の基礎 同時確率分布の例:コイン投げとサイコロ投げの組み合わせ コイン投げ(1次元の確率分布) 1 1 1 1 𝑃 𝑋 = 0 = ,𝑃 𝑋 = 1 = ×0+ ×1 2 2 2 2 1 𝐸 𝑋 = 2 サイコロ投げ(1次元の確率分布) 1 1 1 𝑃 𝑌 = 1 = ,𝑃 𝑌 = 2 = ,𝑃 𝑌 = 3 = , 6 6 6 1 1 1 𝑃 𝑌 = 4 = ,𝑃 𝑌 = 5 = ,𝑃 𝑌 = 6 = 6 6 6 7 𝐸 𝑌 = 386 2
多次元確率分布の基礎 同時確率分布の例:コイン投げとサイコロ投げの組み合わせ コイン投げ(1次元の確率分布) 1 1 𝑃 𝑋 = 0 = ,𝑃 𝑋 = 1 = 2 2 1 𝐸 𝑋 = 2 サイコロ投げ(1次元の確率分布) 1 1 1 𝑃 𝑌 = 1 = ,𝑃 𝑌 = 2 = ,𝑃 𝑌 = 3 = , 6 6 6 1 1 1 𝑃 𝑌 = 4 = ,𝑃 𝑌 = 5 = ,𝑃 𝑌 = 6 = 6 6 6 7 𝐸 𝑌 = 2 𝐸 𝑋 +𝐸 𝑌 =𝐸 𝑋+𝑌 =4 387
事例1:コイン投げとサイコロ投げ 1. 期待値を個別に求めて合計 2. 定義通りに和の期待値を計算
確率変数の和の期待値 コイン投げとサイコロ投げの同時分布 コイン投げ 𝑋 0 1 1 1 12 1 12 サイコロ投げ 𝑌 2 3 4 5 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 6 1 12 1 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
確率変数の和の期待値 コイン投げとサイコロ投げの同時分布 サイコロ投げ 𝑌 1 2 3 4 5 1 1 1 1 1 0 コイン投げ 12 12 12 12 12 𝑋 1 1 1 1 1 1 「確率の表」と「合計値の表」の 12 12 12 12 12 すべてのマス目を掛け算した結果を合計する 6 1 12 1 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
確率変数の和の期待値 和の期待値の計算(同時分布はすべて「12分の1」なのを利用) 1+2+3+4+5+6 + 2+3+4+5+6+7 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
確率変数の和の期待値 和の期待値の計算(同時分布はすべて「12分の1」なのを利用) 1行目 2行目 1+2+3+4+5+6 + 2+3+4+5+6+7 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
確率変数の和の期待値 和の期待値の計算(同時分布はすべて「12分の1」なのを利用) 1+2+3+4+5+6 + 2+3+4+5+6+7 12 21 + 27 48 = = =4 和の期待値は「4」 12 12 コイン投げとサイコロ投げの合計値 コイン投げ 𝑋 0 1 1 サイコロ投げ 2 3 4 𝑌 5 6 1 2 2 3 5 6 6 7 3 4 4 5
事例2:クイズで求めた同時分布 1. 期待値を個別に求めて合計 2. 定義通りに和の期待値を計算
事例2:クイズで求めた同時分布 1. 期待値を個別に求めて合計 2. 定義通りに和の期待値を計算
確率変数の和の期待値 1次元の確率変数の期待値を計算するポイント 1次元の確率分布は「周辺分布」を利用する 周辺確率分布(周辺分布とも呼ぶ)の復習 「組み合わせ」である2次元の同時確率分布を、 「もともとの1次元の確率分布に戻したもの」 というイメージ →周辺分布は、個別に合計が1になる 「元の確率分布」あるいは「1次元の分布」 が知りたい場合は、周辺分布を見る! 396
確率変数の和の期待値 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1 クイズで求めた同時分布と周辺分布 →この表の読み方をもう一度復習
確率変数の和の期待値 0 確率変数 𝑋 1 1 1 3 0 1 3 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 合計 この中が同時分布 (𝑋と𝑌の組み合わせ。すべての組み合わせの 確率を足すと1になる) 合計 1 3 2 3 1
確率変数の和の期待値 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1 ここが𝑋の周辺分布 →向かい側にあるので注意 →端っこ(周辺)にあるから周辺分布と覚えやすい
確率変数の和の期待値 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 ここが𝑌の周辺分布 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1
確率変数の和の期待値 0 確率変数 𝑋 𝐸 𝑋 1 1 3 1 0 合計 1 3 1 2 = ×0+ ×1 3 3 確率変数 𝑌 2 3 2 = 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1
確率変数の和の期待値 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1 2 𝐸 𝑋 = 3 1 1 1 1 2 3 𝐸 𝑌 = ×1+ ×2+ ×3 = + + 3 2 6 3 2 6 2 6 3 = + + 6 6 6 11 = 6
確率変数の和の期待値 1 1 3 0 確率変数 𝑋 1 0 合計 1 3 2 𝐸 𝑋 = 3 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 2 11 = + 3 6 4 11 = + 6 6 15 = 6 5 = 2 11 𝐸 𝑌 = 6 合計 1 3 2 3 1
事例2:クイズで求めた同時分布 1. 期待値を個別に求めて合計 2. 定義通りに和の期待値を計算
クイズ(回答) 同時分布 0 𝑋 1 確率変数の和 1 1 3 0 𝑌 2 3 0 0 1 2 1 6 𝑋 0 1 1 𝑌 2 1 2 2 3 「確率の表」と「合計値の表」の すべてのマス目を掛け算した結果を合計する (確率が0のマス目は無視してOK →0に何をかけても結果は0なので) 3 3 4
クイズ(回答) 同時分布 0 𝑋 1 確率変数の和 1 1 3 0 𝑌 2 3 0 0 1 2 1 6 1 1 1 𝐸 𝑋+𝑌 = ×1+ ×3+ ×4 3 2 6 1 3 4 = + + 3 2 6 2 9 4 = + + 6 6 6 𝑋 0 1 15 = 6 5 = 2 1 𝑌 2 1 2 2 3 3 3 4
確率変数の和の期待値 和の期待値における便利な公式 確率変数𝑋, 𝑌において、以下が成り立つ 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 証明は下記の資料を参照 連続型の確率変数でも成り立つ https://logics-of-blue.com/stats-calc-note/ 前期の講義における最重要公式の1つ 407
条件付き確率分布と独立 以前やった「条件付き確率と独立」と ほぼ同じ内容 408
内容 1.条件付き確率と独立の復習 2.条件付き確率分布 3.確率変数の独立 409
内容 1.条件付き確率と独立の復習 2.条件付き確率分布 3.確率変数の独立 410
条件付き確率 条件付き確率 事象𝐴, 𝐵に対して、以下で計算される𝑃 𝐴 𝐵 を 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」と呼ぶ 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 411
条件付き確率 条件付き確率のイメージ 確率と言えば「全体が1」 →𝑃 Ω = 1 ここで𝑃 𝐵 の確率で起こる事象𝐵が 「実際に起こった」時だけを考慮する →事象𝐵が「実際に起こった」という状況を 「全体が1」と考える。これが条件付き確率のイメージ 412
条件付き確率 条件付き確率の例 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 6の目が出るという事象𝐴 = 6 5以上の目が出るという 事象𝐵 = 5,6 「事象𝐵が起こったことが分かった、という条件における、 事象𝐴の条件付き確率」𝑃 𝐴 𝐵 はいくつになる? ただし、すべての出目は等しい確率で出現する。 413
条件付き確率 6の目が出るという事象𝐴 = 6 5以上の目が出るという 事象𝐵 = 5,6 条件付き確率の例 本来サイコロは6面ある 5以上の目が出た時だけを考える [5以上]という条件で6の目が出る確率は1/2 414
確率の乗法定理 確率の乗法定理 (乗法公式とも呼ぶ) 事象𝐴, 𝐵に対して、 𝑃 𝐴∩𝐵 =𝑃 𝐴 𝐵 ∙𝑃 𝐵 =𝑃 𝐵 𝐴 ∙𝑃 𝐴 (参考)条件付き確率 𝑃 𝐴∩𝐵 𝑃 𝐴𝐵 = 𝑃 𝐵 条件付き確率の言い直し。でも大事 415
確率の乗法定理 確率の乗法定理の例 あるスポーツの試合を対象にする 事象𝐴 = 大会が中止になる 事象𝐵 = 雨である 「雨であるという条件ならば、80%の確率で中止になる」 𝑃 𝐴 𝐵 = 0.8 天気が雨になる確率は40%である 𝑃 𝐵 = 0.4 天気が雨であって、かつ、大会が中止になる確率 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝐵 ∙ 𝑃 𝐵 = 0.8 × 0.4 = 0.32
確率の乗法定理 事象の独立性 下記が成立するとき、事象𝐴, 𝐵が独立であると呼ぶ 𝑃 𝐴∩𝐵 =𝑃 𝐴 ∙𝑃 𝐵 (参考)確率の乗法定理 𝑃 𝐴∩𝐵 =𝑃 𝐴 𝐵 ∙𝑃 𝐵 𝑃 𝐴 𝐵 = 𝑃 𝐴 のとき、事象𝐴, 𝐵は独立 417
条件付き確率分布 事象の独立性の意味 𝑃 𝐴 𝐵 = 𝑃 𝐴 なら、事象𝐴, 𝐵は独立 →条件𝐵が、あっても、なくても、確率が変わらない! 独立な事象の例 事象𝐴 = 単位を取る 事象𝐵 = サイコロで偶数の目が出る 独立ではない事象の例 事象𝐴 = 単位を取る 事象𝐵 = テストで60点以上を取る 418
クイズ 独立 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 3以下の目が出るという 事象𝐵 = 1,2,3 事象𝐴, 𝐵は、独立か独立でないか ① 独立 ② 独立でない
クイズ(回答) 独立 サイコロを1回投げて、出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数の目が出るという事象𝐴 = 2,4,6 3以下の目が出るという 事象𝐵 = 1,2,3 事象𝐴, 𝐵は、独立か独立でないか ① 独立 ② 独立でない
偶数の目が出るという事象𝐴 = 2,4,6 クイズ(回答)3以下の目が出るという 事象𝐵 = 1,2,3 条件付き確率のイメージ 本来サイコロは6面ある 3以下の目が出た時だけを考える 3分の1の確率で 「偶数の目」が出る 𝑃 𝐴 = 1Τ 2 , 𝑃 𝐴 𝐵 = 1Τ3 𝑃 𝐴 𝐵 ≠ 𝑃 𝐴 なので、𝐴, 𝐵は独立でない 421
内容 1.条件付き確率と独立の復習 2.条件付き確率分布 3.確率変数の独立 422
条件付き確率分布 条件付き確率分布 確率変数𝑋, 𝑌に対して、 以下で計算される𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 を 「確率変数𝑌が分かった、という条件における、 確率変数𝑋の条件付き分布」と呼ぶ 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗 423
条件付き確率分布 条件付き確率分布 確率変数𝑋, 𝑌に対して、 以下で計算される𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 を 分子は同時分布 「確率変数𝑌が分かった、という条件における、 確率変数𝑋の条件付き分布」と呼ぶ 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗 分母は周辺分布 424
事例1:コイン投げとサイコロ投げ 1. 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 の計算 2. 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 の計算
事例1:コイン投げとサイコロ投げ 1. 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 の計算 2. 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 の計算
条件付き確率分布 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗 合計 1 2 1 2 1 𝑌の確率で割る 427
条件付き確率分布 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 0 コイン投げ 𝑋 1 合計 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 1 1 2 1 2 1 2 1 2 1 2 1 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 2 2 2 2 1 1 1 1 2 2 2 2 1 1 1 1 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗 列ごとに、合計値は1 428
事例1:コイン投げとサイコロ投げ 1. 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 の計算 2. 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 の計算
条件付き確率分布 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 合計 1 2 1 2 1 𝑋の確率で割る 430
条件付き確率分布 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 0 コイン投げ 𝑋 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 1 1 1 6 1 6 2 1 6 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 6 6 6 6 1 1 1 1 6 6 6 6 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 合計 1 1 行ごとに、合計値は1 431
事例2:クイズで求めた同時分布 1. 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 の計算 2. 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 の計算
事例2:クイズで求めた同時分布 1. 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 の計算 2. 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 の計算
条件付き確率分布 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1 𝑌の確率で割る 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗
条件付き確率分布 1 1 3 0 確率変数 𝑋 1 0 合計 1 3 1Τ3で割る 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 1Τ2で割る 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗 1Τ6で割る
条件付き確率分布 1 確率変数 𝑋 確率変数 𝑌 2 3 0 1 1 0 0 1 0 合計 1 1 1 1 列ごとに、合計値は1 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗
事例2:クイズで求めた同時分布 1. 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 の計算 2. 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 の計算
条件付き確率分布 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1 𝑋の確率で割る 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖
条件付き確率分布 1Τ3で割る 0 確率変数 𝑋 1 1 1 3 0 確率変数 𝑌 2 3 0 0 1 2 1 6 合計 1 3 2 3 2Τ3で割る 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 𝑋の確率で割る
条件付き確率分布 1 確率変数 𝑋 0 1 1 0 確率変数 𝑌 2 3 0 3 4 0 1 4 合計 1 1 行ごとに、合計値は1 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖
内容 1.条件付き確率と独立の復習 2.条件付き確率分布 3.確率変数の独立 441
確率変数の独立 確率変数の独立 すべての𝑖, jで下記が成立するとき、 確率変数𝑋, 𝑌が独立であると呼ぶ 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 ∙ 𝑃 𝑌 = 𝑦𝑗 これは、以下と実質同じ意味 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 = 𝑃 𝑌 = 𝑦𝑗 条件を付けても、確率分布が変わらない 442
事例1:コイン投げとサイコロ投げ
条件付き確率分布 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗 合計 1 2 1 2 1 𝑌の確率で割る 444
条件付き確率分布 コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 0 コイン投げ 𝑋 1 合計 1 1 2 1 2 1 2 1 2 1 2 1 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 2 2 2 2 1 1 1 1 2 2 2 2 1 1 1 1 コイン投げ(1次元の確率分布) 𝑃 𝑋 = 0 = 1Τ2 , 𝑃 𝑋 = 1 = 1Τ2 1次元における𝑋の分布と 条件付き分布が同じ → 𝑋と𝑌は互いに独立445
事例2:クイズで求めた同時分布
条件付き確率分布 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 合計 1 3 2 3 1 もともとの分布(周辺分布)𝑃 𝑋 = 0 = 1Τ3 𝑃 𝑋 = 1 = 2Τ3 条件付き分布 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗
条件付き確率分布 0 確率変数 𝑋 1 1 3 1 0 合計 1 3 1Τ3で割る 確率変数 𝑌 2 3 0 0 1 2 1 2 1 6 1 6 1Τ2で割る 1Τ6で割る
条件付き確率分布 1 確率変数 𝑋 確率変数 𝑌 2 3 0 1 1 0 0 1 0 合計 1 1 1 1 もとの分布(周辺分布)𝑃 𝑋 = 0 = 1Τ3 𝑃 𝑋 = 1 = 2Τ3 条件付き分布 【𝑌 = 1】𝑃 𝑋 = 0 𝑌 = 1 = 1 𝑃 𝑋=1𝑌=1 =0 【𝑌 = 2】𝑃 𝑋 = 0 𝑌 = 2 = 0 𝑃 𝑋=1𝑌=2 =1 【𝑌 = 3】𝑃 𝑋 = 0 𝑌 = 3 = 0 𝑃 𝑋=1𝑌=3 =1
条件付き確率分布 1 確率変数 𝑋 0 1 1 0 合計 1 確率変数 𝑌 2 3 0 1 0 1 1 1 1次元における𝑋の分布と もとの分布(周辺分布)𝑃 𝑋 = 0 条件付き分布が異なる = 1Τ3 𝑃 𝑋 = 1 = 2Τ3 → 𝑋と𝑌は独立ではない 条件付き分布 【𝑌 = 1】𝑃 𝑋 = 0 𝑌 = 1 = 1 𝑃 𝑋=1𝑌=1 =0 【𝑌 = 2】𝑃 𝑋 = 0 𝑌 = 2 = 0 𝑃 𝑋=1𝑌=2 =1 【𝑌 = 3】𝑃 𝑋 = 0 𝑌 = 3 = 0 𝑃 𝑋=1𝑌=3 =1
統計学 I 第14回: 独立同一分布に従う確率変数
内容 1.独立同一分布 2.独立な確率変数の和の分散 3.確率論の復習 452
独立同一分布 453
独立同一分布 独立同一分布 𝑛個の確率変数𝑋1 , 𝑋2 , … 𝑋𝑛 がある。 これらの確率変数が従う確率分布が同じであり、 確率変数同士が互いに独立であるとき、 𝑋1 , 𝑋2 , … 𝑋𝑛 が「独立同一分布に従う」と呼ぶ 独立同一分布はindependently and identically distributedの 頭文字をとってi.i.dと表記することもある 独立であって、かつ、みんな同じ分布 いろいろな制約を置くと計算が楽になる! 454
独立同一分布 独立の復習 すべての𝑖, jで下記が成立するとき、 確率変数𝑋, 𝑌が独立であると呼ぶ 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 ∙ 𝑃 𝑌 = 𝑦𝑗 これは、以下と実質同じ意味 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 𝑃 𝑌 = 𝑦𝑗 𝑋 = 𝑥𝑖 = 𝑃 𝑌 = 𝑦𝑗 条件を付けても、確率分布が変わらない 455
独立同一分布 独立の直感的な意味 条件があってもなくても、分布が変わらない 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 𝑃 𝑋 = 𝑥𝑖 𝑋と𝑌は互いに「無関係」のイメージ 例)コインを投げて表が出たという条件をおいても、 サイコロの出目の確率分布は変わらない 例)コインを投げて表が出たという条件をおいても、 単位を取得する確率は変わらない 456
独立同一分布 独立同一分布ではない例①(同一の分布ではない) コイン投げとサイコロ投げの組み合わせ(2次元確率分布) 1 1 0 12 1 コイン投げ 1 𝑋 12 1 合計 6 2 1 12 1 12 1 6 サイコロ投げ 𝑌 3 4 5 6 1 1 1 1 12 12 12 12 1 1 1 1 12 12 12 12 1 1 1 1 6 6 6 6 先週学んだように、コイン投げとサイコロ投げは独立 合計 1 2 1 2 1 457
独立同一分布 独立同一分布ではない例①(同一の分布ではない) コイン投げ(1次元の確率分布) 𝑃 𝑋 = 0 = 1Τ2 , 𝑃 𝑋 = 1 = 1Τ2 サイコロ投げ(1次元の確率分布) 𝑃 𝑌 = 1 = 1Τ6 , 𝑃 𝑌 = 2 = 1Τ6 , 𝑃 𝑌 = 3 = 1Τ6 , 𝑃 𝑌 = 4 = 1Τ6 , 𝑃 𝑌 = 5 = 1Τ6 , 𝑃 𝑌 = 6 = 1Τ6 コイン投げとサイコロ投げは分布が違う 458
独立同一分布 独立同一分布ではない例②(同一の分布ではない) 𝑛個の確率変数𝑋1 , 𝑋2 , … 𝑋𝑛 がある。 これらの確率変数は独立であるが、 𝑋1 は「平均4、分散2の正規分布」に従い、 𝑋2 は「平均10、分散2の正規分布」に従い、 𝑋3 は「平均4、分散10の正規分布」に従う。 このとき確率変数𝑋1 , 𝑋2 , … 𝑋𝑛 は 独立同一分布に従うと言えない 平均や分散がコロコロ変わるなら、 独立同一分布に従うとは言えない 459
独立同一分布 独立同一分布ではない例③(独立ではない) コイン投げ 𝑌 0 コイン投げ 𝑋 0 1 2 1 0 合計 1 2 1 0 1 2 1 2 合計 1 2 1 2 1 今回は𝑋も𝑌もコイン投げ →裏・表はともに2分の1の確率で出る 460
独立同一分布 独立同一分布ではない例③(独立ではない) コイン投げ 𝑌 0 1 2 0 コイン投げ 𝑋 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 1 0 合計 1 2 1 0 1 2 1 2 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗 合計 1 2 1 2 1 𝑌の確率で割る 461
独立同一分布 独立同一分布ではない例③(独立ではない) コイン投げ 𝑌 0 コイン投げ 1 𝑋 合計 0 1 1 0 1 0 1 1 これが条件付き分布 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 𝑋が裏ならと𝑌も裏。 𝑋が表なら𝑌も必ず表 → 𝑋と𝑌は独立(無関係)ではない 462
独立同一分布 独立同一分布の例① コイン投げ 𝑌 0 コイン投げ 𝑋 1 合計 0 1 4 1 4 1 2 1 1 4 1 4 1 2 合計 1 2 1 2 1 今回は𝑋も𝑌もコイン投げ →裏・表はともに2分の1の確率で出る 463
独立同一分布 独立同一分布の例① コイン投げ 𝑌 0 コイン投げ 𝑋 1 合計 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 = 0 1 4 1 4 1 2 1 1 4 1 4 1 2 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 𝑃 𝑌 = 𝑦𝑗 合計 1 2 1 2 1 𝑌の確率で割る 464
独立同一分布 独立同一分布の例① コイン投げ 𝑌 0 コイン投げ 𝑋 1 合計 0 1 2 1 2 1 1 1 2 1 2 1 これが条件付き分布 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦𝑗 条件付き分布と、周辺分布が同じ! → 𝑋と𝑌は独立(無関係)である 465
独立同一分布 独立同一分布の例② 𝑛個の確率変数𝑋1 , 𝑋2 , … 𝑋𝑛 がある。 これらの確率変数が 独立な「平均4、分散2の正規分布」に従うなら、 𝑛個の確率変数𝑋1 , 𝑋2 , … 𝑋𝑛 は独立同一分布に従うと言える 分布が変わらず、互いに無関係なら 「独立で同一な確率分布に従う」と言える 466
独立な確率変数の和の分散 467
内容 1.独立な確率変数の和の分散の公式 2.独立で同一な確率分布に従う確率変数の 和に関する公式 468
内容 1.独立な確率変数の和の分散の公式 2.独立で同一な確率分布に従う確率変数の 和に関する公式 469
独立な確率変数の和の分散 和の期待値における便利な公式(先週の復習) 確率変数𝑋, 𝑌において、以下が成り立つ 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 前期の講義における最重要公式の1つ 470
独立な確率変数の和の分散 和の期待値における便利な公式(先週の復習) 確率変数𝑋, 𝑌において、以下が成り立つ 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 独立な確率変数の和の分散における便利な公式 互いに独立な確率変数𝑋, 𝑌において、以下が成り立つ 𝑉 𝑋+𝑌 =𝑉 𝑋 +𝑉 𝑌 前期の講義における最重要公式の2つ目 471
独立な確率変数の和の分散 分散の場合は、なぜ「独立」が大事になるのか サ イ コ ロ 投 げ X 1 2 3 4 5 6 合計 1 1Τ36 1Τ36 1Τ36 1Τ36 サイコロ投げ Y 2 3 4 5 6 合計 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1 472
独立な確率変数の和の分散 分散の場合は、なぜ「独立」が大事になるのか 𝑋と𝑌は互いに独立 1 1 1Τ36 サ 2 1Τ36 イ コ 3 1Τ36 ロ 4 1Τ36 投 げ 5 1Τ36 X 6 1Τ36 合計 1Τ6 サイコロ投げ Y 2 3 4 5 6 合計 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ36 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1 473
独立な確率変数の和の分散 分散の場合は、なぜ「独立」が大事になるのか サ イ コ ロ 投 げ X 1 1Τ6 2 サイコロ投げ Y 3 4 5 6 1 0 0 0 0 0 2 0 1Τ6 0 0 0 0 3 0 0 1Τ6 0 0 0 4 0 0 0 1Τ6 0 0 5 0 0 0 0 1Τ6 0 6 0 0 0 0 0 1Τ6 合計 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 合計 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1 474
独立な確率変数の和の分散 𝑋の出目が小さいなら、𝑌の出目も小さい 分散の場合は、なぜ「独立」が大事になるのか 𝑋の出目が大きいなら、𝑌の出目も大きい サ イ コ ロ 投 げ X 1 1Τ6 2 サイコロ投げ Y 3 4 5 6 1 0 0 0 0 0 2 0 1Τ6 0 0 0 0 3 0 0 1Τ6 0 0 0 4 0 0 0 1Τ6 0 0 5 0 0 0 0 1Τ6 0 6 0 0 0 0 0 1Τ6 合計 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 合計 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1Τ6 1 475
独立な確率変数の和の分散 分散の場合は、なぜ「独立」が大事になるのか 𝑋の出目が小さいなら、𝑌の出目も小さくなりやすい 𝑋の出目が大きいなら、𝑌の出目も大きくなりやすい →この時、「確率変数の和」はどうなる? 𝑋 + 𝑌の値が極端に小さい(𝑋も𝑌も小さい)や、 𝑋 + 𝑌の値が極端に大きい(𝑋も𝑌も大きい) ことが頻繁に発生 →ばらつき(分散)が大きくなる! 確率変数同士の関係性によって、 和の分散は変化する 476
独立な確率変数の和の分散 分散の場合は、なぜ「独立」が大事になるのか 𝑋と𝑌が独立でない場合は、以下のように分散を求める ただし𝐶は共分散を表す 𝑉 𝑋 + 𝑌 = 𝑉 𝑋 + 𝑉 𝑌 + 2𝐶 𝑋, 𝑌 証明は下記の資料を参照(少し難しい) https://logics-of-blue.com/stats-calc-note/ 確率変数同士が独立であると仮定すると 計算が簡単になる。後期でも頻繁に登場 477
独立な確率変数の和の分散 和の期待値における便利な公式(先週の復習) 確率変数𝑋, 𝑌において、以下が成り立つ 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 独立な確率変数の和の分散における便利な公式 互いに独立な確率変数𝑋, 𝑌において、以下が成り立つ 𝑉 𝑋+𝑌 =𝑉 𝑋 +𝑉 𝑌 期待値と分散を使いこなせれば前期はOK 478
内容 1.独立な確率変数の和の分散の公式 2.独立で同一な確率分布に従う確率変数の 和に関する公式 479
独立な確率変数の和の分散 和の期待値における便利な公式 独立で同一な確率分布𝐹に従う確率変数𝑋1 , 𝑋2 で、 以下が成り立つ。ただし𝐹の期待値を𝜇とする 𝐸 𝑋1 + 𝑋2 = 𝜇 + 𝜇 = 2𝜇 独立で同一な確率分布𝐹に従う確率変数𝑋1 , 𝑋2 , … , 𝑋𝑛 で、 以下が成り立つ。ただし𝐹の期待値を𝜇とする 𝐸 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 = 𝑛𝜇 期待値𝜇を足し合わせるだけ 480
独立な確率変数の和の分散 和の分散における便利な公式 独立で同一な確率分布𝐹に従う確率変数𝑋1 , 𝑋2 で、 以下が成り立つ。ただし𝐹の分散を𝜎 2 とする 𝑉 𝑋1 + 𝑋2 = 𝜎 2 + 𝜎 2 = 2𝜎 2 独立で同一な確率分布𝐹に従う確率変数𝑋1 , 𝑋2 , … , 𝑋𝑛 で、 以下が成り立つ。ただし𝐹の分散を𝜎 2 とする 𝑉 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 = 𝑛𝜎 2 分散𝜎 2 を足し合わせるだけ 481
クイズ 独立同一分布の期待値と分散 確率変数の和の期待値𝐸 𝑋 + 𝑌 を求めよ コイン投げ 𝑌 0 コイン投げ 𝑋 1 合計 𝟏 ① 𝟐 0 1 4 1 4 1 2 𝟏 ② 𝟑 1 1 4 1 4 1 2 合計 1 2 1 2 1 𝟏 ③ 𝟒 ④ 𝟏 482
クイズ(回答) 独立同一分布の期待値と分散 確率変数の和の期待値𝐸 𝑋 + 𝑌 を求めよ コイン投げ 𝑌 0 コイン投げ 𝑋 1 合計 𝟏 ① 𝟐 0 1 4 1 4 1 2 𝟏 ② 𝟑 1 1 4 1 4 1 2 合計 1 2 1 2 1 𝟏 ③ 𝟒 ④ 𝟏 483
クイズ(回答) 独立同一分布の期待値と分散 確率変数の和の期待値𝐸 𝑋 + 𝑌 を求めよ コイン投げ 𝑌 𝐸 𝑋 = 1 × 0 + 1 × 1 = 1 2 2 2 0 1 合計 0 コイン投げ 𝑋 1 合計 𝟏 ① 𝟐 1 4 1 4 1 2 𝟏 ② 𝟑 1 4 1 4 1 2 1 2 1 2 1 1 1 𝐸 𝑌 = ×0+ ×1 = 2 2 2 1 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 𝟏 ③ 𝟒 ④ 𝟏 484
クイズ(回答) 独立同一分布の期待値と分散 同時分布を一切見なく 確率変数の和の期待値𝐸 𝑋 + 𝑌 を求めよ ても答えられる問題 コイン投げ 𝑌 𝐸 𝑋 = 1 × 0 + 1 × 1 = 1 2 2 2 0 1 合計 1 1 1 0 1 1 1 4 4 2 𝐸 𝑌 = ×0+ ×1 = 2 2 2 1 1 1 コイン投げ 1 𝑋 4 4 2 1 1 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 合計 1 2 2 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟒 ④ 𝟏 485
クイズ(回答) 独立同一分布の期待値と分散 確率変数の和の期待値𝐸 𝑋 + 𝑌 を求めよ コイン投げ 𝑌 𝐸 𝑋 = 1 × 0 + 1 × 1 = 1 使うのは周辺分布だけ 2 2 2 0 1 合計 0 コイン投げ 𝑋 1 合計 𝟏 ① 𝟐 1 4 1 4 1 2 𝟏 ② 𝟑 1 4 1 4 1 2 1 2 1 2 1 1 1 𝐸 𝑌 = ×0+ ×1 = 2 2 2 1 𝐸 𝑋+𝑌 =𝐸 𝑋 +𝐸 𝑌 𝟏 ③ 𝟒 ④ 𝟏 486
クイズ 独立同一分布の期待値と分散 確率変数の和の分散𝑉 𝑋 + 𝑌 を求めよ コイン投げ 𝑌 0 コイン投 げ 𝑋 1 合計 𝟏 ① 𝟐 0 1 4 1 4 1 2 𝟏 ② 𝟑 1 1 4 1 4 1 2 合計 1 2 1 2 ヒント 周辺分布を使って𝑋と𝑌 の分散𝑉 𝑋 , 𝑉 𝑌 を計算 そして以下の公式を利用 𝑉 𝑋 +𝑉 𝑌 =𝑉 𝑋+𝑌 1 𝟏 ③ 𝟒 ④ 𝟏 487
クイズ(回答) 独立同一分布の期待値と分散 確率変数の和の分散𝑉 𝑋 + 𝑌 を求めよ コイン投げ 𝑌 0 コイン投 げ 𝑋 1 合計 𝟏 ① 𝟐 0 1 4 1 4 1 2 𝟏 ② 𝟑 1 1 4 1 4 1 2 合計 1 2 1 2 ヒント 周辺分布を使って𝑋と𝑌 の分散𝑉 𝑋 , 𝑉 𝑌 を計算 そして以下の公式を利用 𝑉 𝑋 +𝑉 𝑌 =𝑉 𝑋+𝑌 1 𝟏 ③ 𝟒 ④ 𝟏 488
1 𝐸 𝑋 = 2 クイズ(回答) 1 𝐸 𝑌 = 2 独立同一分布の期待値と分散 確率変数の和の分散𝑉 𝑋 + 𝑌 を求めよ コイン投げ 𝑌 0 コイン投 げ 𝑋 1 合計 𝟏 ① 𝟐 0 1 4 1 4 1 2 𝟏 ② 𝟑 1 1 4 1 4 1 2 合計 1 2 1 2 1 𝑉 𝑋 = × 0−𝐸 𝑋 2 2 1 + × 1−𝐸 𝑋 2 2 1 𝟏 ③ 𝟒 1 1 = × − 2 2 1 = 4 ④ 2 1 1 + × 2 2 𝟏 489 2
1 1 𝐸 𝑋 = 𝐸 𝑌 = クイズ(回答) 2 2 1 独立同一分布の期待値と分散 𝑉 𝑋 = 4 確率変数の和の分散𝑉 𝑋 + 𝑌 を求めよ 1 2 コイン投げ 𝑌 𝑉 𝑌 = × 0−𝐸 𝑌 2 0 1 合計 1 2 1 1 1 + × 1−𝐸 𝑌 0 2 4 4 2 コイン投 2 2 1 1 1 1 1 1 1 げ 1 = × − + × 4 4 2 𝑋 2 2 2 2 1 1 合計 1 1 2 2 = 4 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟒 ④ 𝟏 490
1 𝐸 𝑋 = クイズ(回答) 2 1 独立同一分布の期待値と分散 𝑉 𝑋 = 4 確率変数の和の分散𝑉 𝑋 + 𝑌 を求めよ 1 𝐸 𝑌 = 2 1 𝑉 𝑌 = 4 コイン投げ 𝑌 0 コイン投 げ 𝑋 1 合計 𝟏 ① 𝟐 0 1 4 1 4 1 2 𝟏 ② 𝟑 1 1 4 1 4 1 2 合計 1 2 1 2 𝑉 𝑋+𝑌 =𝑉 𝑋 +𝑉 𝑌 1 𝟏 ③ 𝟒 1 1 = + 4 4 1 = 2 ④ 𝟏 491
おまけ① 便利公式を使わないで、 定義通り分散を計算してみる (少し難しいが、独立の重要性がわかるはず) (周辺分布は使わず、同時分布から計算する) (大変だと思うので、期末テストには出ない) 492
確率変数の和の分散 期待値の計算 確率変数において、以下で計算される値のこと 期待値=「確率×その時の値」の合計 (連続型の確率変数を相手にする場合は積分する) 分散の計算 「確率変数が、期待値から どれだけ離れていると期待できるか」を表した指標 𝑉 𝑋 =𝐸 𝑋−𝐸 𝑋 2 差異 𝑋 − 𝐸 𝑋 期待値 2 の 確率変数𝑋とその期待値𝐸 𝑋 の差異 493
確率変数の和の分散 確率変数の和の分散を定義通り計算する流れ 1.「𝑋𝑖 + 𝑌𝑗 」と「𝐸 𝑋 + 𝑌 」を計算 2. 「𝑋𝑖 + 𝑌𝑗 」と「𝐸 𝑋 + 𝑌 」の差の2乗を計算 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 2 3.Step2で計算された差異に対して期待値を計算する (同時確率を掛けてから、掛け算の結果を合計する) 𝑉 𝑋+𝑌 =𝐸 𝑋+𝑌 −𝐸 𝑋+𝑌 2 差異 𝑋 + 𝑌 − 𝐸 𝑋 + 𝑌 の期待値 2 494
確率変数の和の分散 確率変数の和の分散 確率変数の和の分散𝑉 𝑋 + 𝑌 を求めよ コイン投げ 𝑌 0 コイン 投げ𝑋 1 合計 0 1 4 1 4 1 2 1 1 4 1 4 1 2 すでにクイズで求めたので 合計 1 𝑉 𝑋+𝑌 = 1 2 定義通り計算しても、 2 同じ結果になることを確認 1 2 1 495
確率変数の和の分散 𝐸 𝑋 + 𝑌 = 1であることを利用 確率変数の和 𝑋𝑖 + 𝑌𝑗 コイン投げ𝑌 0 1 コイン 投げ𝑋 0 1 0 1 1 2 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 2乗する前の 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 コイン投げ𝑌 コイン投げ𝑌 0 1 0 1 0 1 0 0 −1 0 コイン コイン 投げ𝑋 投げ𝑋 1 0 1 1 0 1 2
確率変数の和の分散 同じ色のマス目を掛け算 同時分布 コイン 投げ𝑋 0 1 コイン投げ𝑌 0 1 1 1 4 4 1 1 4 4 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 2 コイン投げ𝑌 0 1 コイン 投げ𝑋 同時分布 × 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 →掛け算の結果 コイン 投げ𝑋 0 1 2 0 1 1 0 0 1 コイン投げ𝑌 0 1 1 0 4 1 0 4
確率変数の和の分散 2 同時確率 × 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 →掛け算の結果 コイン 投げ𝑋 0 1 コイン投げ𝑌 0 1 1 0 4 1 0 4 掛け算の結果を合計すると、分散になる 𝑉 𝑋+𝑌 =𝐸 𝑋+𝑌 −𝐸 𝑋+𝑌 2 1 1 1 = +0+0+ = 4 4 2
確率変数の和の分散 結果のまとめ 定義通り𝑉 𝑋 + 𝑌 を計算しても、 便利公式を使って𝑉 𝑋 + 𝑌 = 𝑉 𝑋 + 𝑉 𝑌 から計算しても、 結果は同じ2分の1となった こんな面倒な計算をして何が楽しいの? 便利公式がなければ、和の分散𝑉 𝑋 + 𝑌 を求めるのが、 とても大変だというのを体験してほしかった また、独立でない場合はこの大変な計算をする羽目になる →独立って便利な仮定なんだと体験してほしかった 499
おまけ② 独立じゃなかった場合の、和の分散の計算例 (細かい計算は端折る) (期末テストには出ない) 500
確率変数の和の分散 独立同一分布ではない例(独立ではない) コイン投げ 𝑌 0 コイン 投げ𝑋 0 1 2 1 0 合計 1 2 1 0 1 2 1 2 合計 1 2 1 2 1 501
確率変数の和の分散 同時分布が変わった 同時分布 コイン 投げ𝑋 0 1 コイン投げ𝑌 0 1 1 0 2 1 0 2 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 コイン投げ𝑌 0 1 コイン 投げ𝑋 同時分布 × 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 →掛け算の結果 掛け算の結果も変わる 2 コイン 投げ𝑋 0 1 2 0 1 1 0 0 1 コイン投げ𝑌 0 1 1 0 2 1 0 2
確率変数の和の分散 コイン投げ 𝑌 0 1 1 0 0 コイン投 2 げ 1 𝑋 1 0 2 1 1 2 𝑋+𝑌 −𝐸 𝑋+𝑌 = +0+0+ =1 2 2 同時確率 × 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 →掛け算の結果 𝑉 𝑋+𝑌 =𝐸 2 分散が増えた!
おまけ③ 独立じゃなかった場合の、和の分散の計算例② (細かい計算は端折る) (期末テストには出ない) 504
確率変数の和の分散 独立同一分布ではない例(独立ではない) コイン投げ 𝑌 0 0 コイン投 げ 𝑋 1 合計 0 1 2 1 2 1 1 2 0 1 2 相手が1なら 自分は0、 相手が0なら 自分は1 合計 1 2 1 2 1 505
確率変数の和の分散 同時分布が変わった 同時分布 コイン 投げ𝑋 0 1 コイン投げ𝑌 0 1 1 0 2 1 0 2 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 コイン投げ𝑌 0 1 コイン 投げ𝑋 同時分布 × 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 →掛け算の結果 全部0になってしまった! 2 コイン 投げ𝑋 0 1 2 0 1 1 0 0 1 コイン投げ𝑌 0 1 0 0 0 0
確率変数の和の分散 2 同時確率 × 𝑋𝑖 + 𝑌𝑗 − 𝐸 𝑋 + 𝑌 →掛け算の結果 コイン 投げ𝑋 𝑉 𝑋+𝑌 =𝐸 𝑋+𝑌 −𝐸 𝑋+𝑌 分散が0になった! 0 1 2 コイン投げ𝑌 0 1 0 0 0 0 =0+0+0+0=0
確率変数の和の分散 独立同一分布ではない例(独立ではない) コイン投げ 𝑌 0 0 コイン 投げ𝑋 1 合計 0 1 2 1 2 1 1 2 0 1 2 合計 1 2 1 2 1 相手が1なら自分は0。相手と逆の目を出す →合計値は常に「1」で変わらず、分散0 508
確率変数の和の分散 結果のまとめ 独立ではない確率変数同士では、 便利公式𝑉 𝑋 + 𝑌 = 𝑉 𝑋 + 𝑉 𝑌 が 成り立たないことが分かった こんな面倒な計算をして何が楽しいの? 独立でなかったら、色々な計算がすごく複雑になる →独立という「仮定」を置いて、後期では色々計算する →この仮定の意味を知ってもらいたかった 509
確率変数の和の分散 𝑖 = 1,2, … , 𝑚; 𝑗 = 1,2, … , 𝑛とする 期待値の計算公式(多次元のものは参考程度) 𝑚 期待値 𝐸 𝑋 = 𝑃 𝑋 = 𝑥𝑖 ∙ 𝑥𝑖 𝑖=1 𝑚 𝑛 和の期待値 𝐸 𝑋 + 𝑌 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 ∙ 𝑥𝑖 + 𝑦𝑗 𝑖=1 𝑗=1 分散の計算公式(多次元のものは参考程度) 𝑚 分散 𝑉 𝑋 = 𝑃 𝑋 = 𝑥𝑖 ∙ 𝑥𝑖 − 𝜇 2 𝑖=1 和の分散 𝑚 𝑛 𝑉 𝑋 + 𝑌 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 ∙ 𝑖=1 𝑗=1 𝑥𝑖 + 𝑦𝑗 − 𝐸 𝑋 + 𝑌 2
独立な確率変数の和の分散 まとめ 独立で同一な確率分布𝐹に従う確率変数𝑋1 , 𝑋2 , … , 𝑋𝑛 を想定すると、様々な計算が簡単になる 独立同一分布は便利! 後期では、標本(手に入った一部のデータ)の特性を調べる 確率論を駆使して様々な分析を行う 統計学の初等的な講義では、独立同一分布を常に仮定する →「計算を簡単にする仮定」を置いていることに注意! 統計分析の意味と仮定を理解する前期 511
独立な確率変数の和の分散 前期と後期の繋がり 前期①:中間テストまで 手に入ったデータを集計する方法を学んだ →でも「手に入った標本」と「母集団」が 全然違っているかもしれない 前期②:中間テストから 「標本」は確率的に変化すると想定される →確率論を学んで、「標本」を取り扱う基礎を身につける →特に期待値と分散は、応用的にも、とても大切 512
独立な確率変数の和の分散 前期と後期の繋がり 後期①:中間テストまで 抽象的な「確率論」と現場の「統計分析」をつなげる →確率論を適用するためのサンプリングの考え方を学ぶ そして母集団の平均と分散を推定する方法を学ぶ →確率論を使う 後期②:中間テストから 母集団について何らかの「判断」を下す方法を学ぶ 前期の内容をベースにして、 後期を進める。似た内容も多い 513