626 Views
September 27, 23
スライド概要
university student
サンプルサイズと 測定尺度 第2回 社会科学情報処理 本資料は立教大学「社会科学情報処理(古賀)」の授業での使用を目的としたものです。 当該授業での学習目的以外の利用を禁じます。また本資料の全体、または一部の インターネットへのアップロード、または二次使用などを一切禁じます。
調査に求められる要素 妥当性 • 調査が目的とする内容を問題なく測定できる • 項目内容、調査手法、調査対象などが影響する 信頼性 • 時間や回答者に関わらず同じ量の測定結果は一定 • 内容、手法、対象の影響に加えサンプルサイズも影響する
サンプル数とサンプルサイズ サンプル数 • 母集団から抽出された「データの集まり」の数 • 条件や採取カテゴリーなどを別サンプルとして扱う場合一つの調査でもサンプル数は複数になる サンプルサイズ • サンプル内に存在するデータ件数 例えば下のようなサンプルがあるとすると インターネット調査 回答数:500 電話調査 回答数:75 サンプルサイズ500のサンプルとサンプルサイズ75のサンプルで 合計「サンプル数」は2、合計「サンプルサイズ」は575となる。
サンプルサイズの指標:信頼区間 ■ 母集団平均とサンプル平均の誤差をどの程度許容するか? – サンプルサイズが大きい程、誤差の範囲は狭くなる – どの程度の誤差範囲に収めたいかでサンプル数が決まる ■ 例えば選択率の誤差範囲はp±1.96×√p(1-p)/n で計算可能 – pはある回答が選択される確率 ■ サンプル平均が収まる範囲を信頼区間という(慣習的に95%を利用) サンプルサイズと選択率による95%信頼区間(1.96×√p(1-p)/n ) サンプルサイズ 10 50 100 200 500 1000 1% 6.17% 2.76% 1.95% 1.38% 0.87% 0.62% 2% 8.68% 3.88% 2.74% 1.94% 1.23% 0.87% 選択率 5% 13.51% 6.04% 4.27% 3.02% 1.91% 1.35% 10% 18.59% 8.32% 5.88% 4.16% 2.63% 1.86% 50% 30.99% 13.86% 9.80% 6.93% 4.38% 3.10%
サンプルサイズの指標:効果量と検定力 効果量 • 条件間の違いや関連性などをサイズに影響されない値に変換(標準化)したもの 検定力 • 実際に違いがあるときに分析結果でも「違いがある」となるための指標 効果量と最低標本サイズ 差の効果量 検定力 0.80 相関の効果量 検定力 0.80 0.20(小さい) 787 0.10(小さい) 782 0.50(中程度) 128 0.30(中程度) 84 0.80(大きい) 52 0.50(大きい) 29
量的調査の分析手法(頻度統計) 記述統計 統計的検定 多変量解析 •調査結果の傾向を整理 •調査結果から全体的傾向を推測 •全体的傾向に関する仮説を検証する •因果関係をモデル化し結果を予測 •回答者の傾向を分類
調査で利用される回答方法と値変換 単一選択法:選択項目に数値をつけておき、その値を利用 •タブレットPCを持っていますか? はい ・ いいえ 複数選択法:選択項目ごとに選択されたか否かを1と0で集計 •インターネット接続に利用している機器(複数回答可) •「デスクトップPC ・ ノートPC ・ タブレットPC ・スマートフォン ・ ゲーム機 ・ その他」 評定法:あてはまりやポジティブ傾向に合わせて選択項目に数値をつけ、その値を利用 •SNSを利用しますか? •「1 よく利用する 2 どちらともいえない 3 あまり利用しない」 自由記述:回答者が自由に記述した文章を評定者が分類し、分類別に値をつけて利用 •SNSをどのような目的で利用するか、自由に記述してください
尺度(数値)の4分類(Stevens, 1946) 質 的 変 数 名義尺度 •分類を表し入換可能、計算不可 順序尺度 •順番を表し入換不可、計算不可 量 的 変 数 間隔尺度 •等間隔の距離を持つ離散変量、入換不可、計算可 比例尺度 •原点0を持ち比率が一定の実数、入換不可、計算可
名義尺度 ■ 数値は分類(内容の違い)を表すが意味のある割り当てではない – 数値の大きさを分類に関連付けて割り当てていない でも 1 2 3 1 3 2 でも項目上問題はない (逆に曜日のような順序の ある項目で数値と順序が 不一致だと違和感が生じる) ■ 計算に利用できない – 計算しても算出された値と分類の間につながりが無い 1+2=3 だが 同様に数値の大きさ に意味があるなら と を足しても を2倍したら になるわけではない になり ÷2は を意味することに なってしまう
順序尺度 ■ 数値の大きさは順序という意味を持つ(交換不可) ■ 数値の間隔が一定とは限らない 1位と2位は甲乙つけがたいかもしれない ダントツ1位の項目かもしれないし ■ 計算に利用できない – 算出された値と内容や実態が一致しない可能性がある (1位)と また1週間必ず30分勉強した 1日ごとの順位は と1日だけ4時間勉強し残り6日は何もしなかった 2,1,1,1,1,1,1で平均1.14、 1週間の勉強時間合計は (3位)になるわけではない (2位)を足したら が210分、 に順位をつけると の順位は1,2, 2, 2, 2, 2, 2で平均1.86となり が240分で が上の順位になる が上になるが
間隔尺度 ■ 数値の大きさに意味があり、間隔も一定である数値 1 2 3 4 5 ■ 間隔が等しいので計算結果と内容が一致する 1 と 1 の計は 2間隔の大きさに等しい • 「等間隔」が重要なので「はい」「いいえ」のように2項目(間隔が1つ)しかない回答の 値は間隔尺度にはならない • 実際には等間隔に並んだ数ではなく「賛成」「どちらでもない」「反対」など言葉への 回答を求めることが多い。言葉の強さに対する感覚は人によって違うため、そのような 項目は厳密には等間隔の尺度ではなく順序尺度として扱うべきだが、便宜的に間隔尺度 として扱われている (そのような問題を防ぐために回答箇所には等間隔を意識させる目盛などの工夫が必要)
比例尺度 ■ 数値は大きさに加えて一定の間隔を持つ ■ 「無し」の状態を表す原点0を持つ – 比率の比較に意味がある ■ 整数の間(小数点以下の数値)も測定できる – 客観的な長さや重さ、時間などは比例尺度の値 – 人数などは「無し」は存在するが小数点以下の値は 現実には存在しないため比例尺度ではない 東京 のような言い方は目安として意味を持つが、あくまで便宜的な 言い方であり実際に0.45台の車が存在する訳ではない 1軒あたり0.450台
記述統計量 名義尺度/順序尺度の場合 •質問紙の数値自体は分析に利用できない •数値=分類に該当する人数/個数を分析に利用する •分類が現れる頻度を表すので「度数」という •度数を表の形でまとめることが多い 間隔尺度/比例尺度の場合 •質問紙の数値自体を分析に利用できる •代表値を算出しデータの傾向を表す
代表値:量的データの特徴を表す数値 (サンプルの値を3,5,2,7,5,4,3,6,5とすると) ■ 平均(算術平均/相加平均) – サンプルの総計をサンプルサイズで割ったもの ■ (3+5+2+7+5+4+3+6+5)÷9=4.44 ■ 中央値 – サンプル全ての値を大小順に並べ中央に位置する値 ■ 大小順に並べると2,3,3,4,5,5,5,6,7→5番目にあたる5 ■ 標本数が偶数の場合は中央の2つの値の平均を利用 ■ 最頻値 – 回答の値を一定区間に区切り最も度数の大きい区間 ■ 度数自体が最頻値ではない ■ 2,4,6,7の度数が1、3の度数が2、5の度数が3→度数が最大の5 ■ 最頻値は複数存在する可能性がある
平均値 ■ 全ての値が関わった数値なので代表値として価値が高い ■ 全ての値が影響するため外れ値の影響を強く受ける 今月電車に乗った日数を尋ねて各回答者から以下の値が得られたとする (図は各回答者の回答を横に並べており、電車の数が乗った日数を表す) 平均値3 平均値2 その値以上と以下の距離の合計が同じになる位置が平均 (重心の位置) こ の 値 に 引 き ず ら れ て 平 均 が 上 が っ て い る 外れ値(全体の傾向から大きく外れた値)があると 平均値はその方向に引きずられてしまう
中央値 ■ 大小順に並べた中央の値だけに注目するので 値に影響する要素は少ない ■ 外れ値の影響を受けない 図は今月電車に乗った日数の回答を大小順に並べたもの 中央値以外の値は影響しない 中央値2 10件のデータを大小順に並べた5件目と6件目の値 • • 件数が偶数だと中央が2つになるのでその平均を採る 奇数の場合中央の値は1つなので値をそのまま採択する 中央値2 外 れ 値 が ど れ だ け 大 き く て も 影 響 し な い
最頻値 ■ 影響する要素が多いかどうかは場合による – 頻度の偏りが少ないと代表値としての価値は小さくなる ■ 複数の最頻値が存在する場合がある – その場合は平均値をとらず並記する ■ 外れ値の影響は受けない 最頻値は1と3。平均をとると実際の 最頻値ではない2になってしまう 全体に分布の偏りが小さく 1も3も他の値とそれほど 頻度は変わらないので 1と3は最頻値ではあるが 集団の実態とはいいにくい 最頻値1 最頻値3 外 れ 値 が ど れ だ け 大 き く て も 影 響 し な い
代表値の選択 ■ 充分な数が無作為抽出されている標本 – 「全ての値を算出に利用=情報量が多い」平均値が 一般に利用される ■ 標本数が少ない、または外れ値が存在する標本 – 外れ値に影響されない中央値が一般に利用される ■ 頻度に偏りがある、または中央の頻度が最大でない標本 – 最頻値を利用する場合がある たとえば下のようなデータはどの値を代表値とするのが適切か? 「家計調査報告(貯蓄・負債編):貯蓄現在高階級別世帯分布-2019年- (二人以上の世帯)(P6)」 総務省統計局
ダレル・ハフ「統計でウソをつく法」 講談社ブルーバックス p48 相加平均と中央値と最頻値の誤差 ■ 3つの値に大きく差がある例(左) ■ 3つの値が一致する例(下) 最頻値2 平均値2 中央値2 • 外れ値が無い • 大小順に並べた時に中央にくる値ほどデータ数が多い • 左右両方向の端に近い値程データ数が少ない と3つの値は一致しやすい
平均については散布度も考慮する 散布度(ばらつき)が異なると同じ平均値でも意味が異なる可能性がある 5 良い 4 まあまあ良い 3 普通 2 あまりよくない 1 悪い 商品A レビュー 平均3点 1人 2人 10人 2人 1人 商品B レビュー 平均3点 6人 1人 2人 1人 6人
散布度の種類 範囲:最小値から最大値までの幅 • 範囲は外れ値に影響されやすくデータの偏りを表すことができない 四分位数:大小順に並べたデータを個数で4分割し1/4、2/4、3/4に該当する値 • 1/4にあたる値をQ1、2/4にあたる値をQ2、3/4にあたる値をQ3と表す(Q2は中央値と同じ) • 中央を示す値として平均値や中央値以外に四分位偏差 (Q3―Q1) / 2も使用される 標準偏差(SD):標本が平均からどの程度離れているかを表す • 標本の中央にデータが集まる左右対称形のばらつき(正規分布)である場合 • 標本±SDの範囲に標本の約68.3%が含まれる • 標本±2SDの範囲に標本の約95.4%、標本±3SDの範囲に約99.7%が含まれる