-- Views
May 01, 25
スライド概要
オープンゼミ #7 の資料です。
ななーる訪問看護デベロップメントセンターでは、「看護研究を"楽しむ"のみんなのTIPS」と題して、定期的なオープンゼミを開催します。
このオープンゼミの目的は、看護師や若手研究者、看護系大学生・院生が看護分野の研究に対する理解を深め、知識を共有し、研究コミュニティの輪を広げることです。
〇参加できる方
・看護師
・保健師
・助産師
・看護系学生
・看護系研究に関わる研究職や教職員
いずれの方も、ゼミの参加者・発表者双方の役割を自由に担うことができます。
弊センターは訪問看護に関する研究施設ですが、オープンゼミは研究フィールド等を制限しません。
詳しくはゼミページへ:https://seminar-dc.peatix.com
訪問看護・在宅看護の研究施設「ななーる訪問看護デベロップメントセンター」のセンター長。「研究と実践をつなぐ」がミッション。 研究テーマ:神経難病支援、訪問看護データベース研究 etc
オープンゼミ #7 『統計、きそのきそ』 2025年4月28日(月) 18時~
今日のゼミの目標 統計きそのきそ,「2次元データの見方」 特に「2群間の値の比較」を徹底マスターする
データを見る3つの視点 • 単変量(one-dimensional) 1種類の数値を一列に並べた世界 例)40人の血圧、ある事業所の1日の訪問件数 • 二変量(two-dimensional) 変量を2つ同時に扱い、“関係性”や“差”に目を向ける 数×数:年齢と血圧、身長と体重 など 数×群:ある薬を飲んだ群と飲んでいない群の血圧 など 群×群:薬の内服有無と脳卒中発症の有無 など • 多変量(multi-dimensional) 3つ以上の変数が同時に絡み合う 例)服薬の有無、年齢、性別、体重を同時に入れた血圧の予測モデル など ※変量:異なる値を取ることのできる変数
2次元のデータとは • 同じ観察単位に対して2つの変量を測定したデータ 各対象(例:患者一名、一日)に対し、2つの異なる変数 “関係性”や“差異”を捉えることができる 主な分析 図示手法 数×数 相関、回帰 散布図 数×群 群間比較(t検定やWilcoxon) 箱ひげ図、ヒストグラム 群×群 χ二乗検定、フィッシャーの正確確率検定 クロス集計表、ヒートマップ ※群とは,いわゆるカテゴリカルデータ
2次元のデータを用いた比較の前提 • 例えば…… ななーる訪問看護では、高齢者が自宅でできる 画期的な運動プログラム「ななーる体操」を開発 この体操の効果を調べたい 指標はバーセルインデックス(BI)とする • 理想的な効果測定方法は 全国にいる高齢者を全て集める(3623万人) ランダムにななーる体操をする群としない群に分ける BIの値を比較する ※より理想なのは、全高齢者を二人に分身させて比較 • しかし,現実的にはそんなことはできない →では,どうするか 令和6年版 高齢社会白書
実際の研究アプローチ N = 36,230,000 n = 100 ななーる体操実施群 VS (平均BIを比較) 母集団 (全国の高齢者) 標本 (現実的に集められる高齢者) 比較群 標本を比較することで、母集団全体の傾向を推測する →この母集団の傾向(母平均や母分散など)を“母数 (Parameter)”という ※母数=分母やサンプルサイズのことではない
なぜ“標本”で“母集団”の傾向がわかるのか 味噌汁の味を確認するには…… ※ただし,ここでいう味とは「塩分濃度」とする 小さなスプーン一杯 →上澄みなのか底なのかわからない →偶然薄かったり,濃かったりする可能性 スプーンより大きいお椀ですくう →サンプルサイズを大きくする 母集団 よく混ぜてからすくう →ランダムサンプリング 標本
お椀が大きいほど,鍋全体の味に近づく すくう量が少ないと毎回濃さが違う →鍋の味噌汁(母集団)と違う確率が高い 大きいお椀ですくえば 鍋の味噌汁(母集団)との誤差が減る 一つひとつの味の濃さは少しずつ違う 多くすくえばすくうほど(サンプルサイズが大きい), 母集団(鍋)の平均に近づく→大数の法則
正規分布 (前回のおさらい) • 正規分布:平均値の周りにデータが集まり 左右対称な釣鐘型の形をした連続確率分布 • 正規分布の特徴 平均値を中心に左右対称 データが平均値付近に集中し 離れるほどデータが少ない 平均値 = 中央値 = 最頻値 (理論上は) 釣鐘→
お椀で何度もすくったら 鍋の味噌汁の濃度 (母平均) お椀一杯の味噌汁の塩分濃度を考える = 1サンプル そのお椀一杯の味噌汁の塩分濃度 = 1サンプルの平均 とする 鍋の味噌汁の塩分濃度 = 1.0%とする(母平均) ↑本当はこれを知りたい サンプルサイズが十分大きい(お椀が大きい)時 標本平均の分布は正規分布に近づく つまり,サンプルサイズ十分大きければ 母平均に分布が集中する →これを中心極限定理という ※念のため…… サンプルサイズ:すくった味噌汁の量 サンプル数:すくったお椀の数 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
2つの群を比べるには • 「Aさんが作った味噌汁」と「Bさんが作った味噌汁」の味を比べたい Aさん Bさん • 理想は,鍋の味噌汁を全部調べたい →しかし,それをしたらなくなってしまう VS • 小さなスプーンだと,スプーンですくった部分が偶然薄い or 濃いのかわからない VS • より大きいお椀で比べれば,鍋の味噌汁の味に近い比較ができる(大数の法則) ただ,どのくらいお椀を使えばいいのか(飲みすぎたらなくなる)→必要サンプルサイズの計算
2つの群を比べるには n = 50 85点 • 今回の問い 「ななーる体操実施群 vs 比較群 →平均BIに差があるのか」 • 結果:2群間で平均BIに5点の差 80点 n = 50 • この差は偶然なのか,必然なのか ここで統計的仮説検定の出番
統計的仮説検定 • ななーる体操実施群と比較群の“5点”という差 統計学的に有意な差 or たまたま? • その差が偶然のばらつきである可能性を排除したい ・たまたま測定者の誤差があった ・たまたま測定時の対象者の調子がよかった etc... →本当に体操の効果なのかわからない • 帰無仮説が成り立つのかを考える 対立仮説:体操の効果が合ってBIに差が生じる→本当はこれを知りたい 帰無仮説:体操の効果がなくBIに差がない→これが否定できればいい 帰無仮説が正しいと仮定したときに,これと同じかより極端な差が生じる確率 →p値 今回の例なら,「平均の差が5点以上になる確率」 p値が小さいならば,帰無仮説のもとでその結果は十分珍しいと判断 →帰無仮説を棄却できる
2群の差を比べる:t検定 • よく聞く“t検定”は,“差÷標準誤差”から判断している • 2群間の平均値を比べる しかし,単純に平均値のみを比べても偶然性を判断できない 標本平均がどれくらいばらつくか(標準誤差)も考慮して判断する • t検定がやっていること(AとBの二つのグループを比較する例) ①2群の平均値の差をみる:Aの平均値ーBの平均値(さっきの例:85-80=5) ②①を標準誤差=標本平均のばらつき=√(Aの分散/na)+√(Bの分散/nb) で割る →これがt値 |t値|が大きい→平均値の差が,そのばらつきを加味しても十分大きい |t値|が小さい→平均値の差が,そのばらつきの範囲に入るくらい小さい
標準偏差 (前回のおさらい) • 平均値からの「バラつき」を示す • 一人一人の平均からのズレの二乗を合計して,データの個数で割る→分散 分散の平方根(ルート)を取る→標準偏差 ※標本の分散の場合はn-1で割る 標準偏差 = 177 165 +13 -7 145 個人の平均値からのズレ 2の合計 データの個数 +25 160 平均:152 +8 -39 113 (−7)2+(13)2 +(25)2 + (8)2 + (−39)2 = 24.6 5−1
t検定:t値で差の有無をどう判断するのか • t値は「平均値の差÷標準誤差」 • 標本平均の差の分布は”t分布”に従う • 観測されたt値以上に極端な値が得られる確率 (= p値) を求める 具体的には…… 2群に差がなければ0 赤い部分の面積/曲線下全体の面積 n = 20のt分布
t検定の前提 • 真にしりたいこと:この介入は対象集団に効果があるのか つまり,母集団の平均(母平均)に差があるのか • しかし,母集団全体のデータを入手するのは困難 利用可能な標本の平均値(標本平均)から推定する • 標本平均の差がどれくらい大きいかを評価する 評価にはt値を使用 t値がt分布に従うことを前提にしている t値がt分布に従っていないと,正確に母集団の差を評価できない
t検定の前提 • t値=標本平均の差/標準誤差 t値がt分布に従うには…… 標本平均差の分布が 理論通りになる 標本分散の推定が 正確である 独立性 分散推定の正確さ 母集団の正規性 等分散性
母集団が正規分布であること • 母集団が正規分布でないと,t分布が歪む ただし,普通は母集団の分布は確認できない →標本の分布をみて判断する →正規分布を仮定できないなら,ノンパラメトリック検定も選択肢 母集団が正規分布 母集団が非正規分布
母集団の正規分布と中心極限定理 • t検定の前提は,「標本平均の差がt分布に従う」 正規分布は絶対条件ではない • 中心極限定理 サンプルサイズが大きければ標本平均の分布は正規分布に近づく →サンプルサイズが十分大きければ,t値はt分布に近づく ※一般的な基準はn > 30 n=6 n = 30 n = 50
等分散性であること • 等分散(2群のばらつきが同じ)でないと,t分布を満たせない やはり母集団の分散はわからないことが多い →標本の分布やLevene検定などで確認 →等分散性を仮定できないなら,Welchのt検定も選択肢
その差には意味があるのか • t検定→有意差があった その差の意味とは • t値:サンプルサイズが大きいと大きな値になりやすい(逆もしかり) t値 = AとBの平均値の差 √(Aの分散/na)+√(Bの分散/nb) • サンプルサイズに影響されない,その差の大きさを見るには 効果量(Cohen’s d) →2群の平均の差を標準偏差で割った値 目安; 0.2 小さい効果 0.5 中程度の効果 0.8 大きな効果
その差には意味があるのか • 統計的検定は,サンプルサイズが大きいと小さな差でも有意となりやすい • その差が”臨床的に意味があるのか”も考える • 例えば ななーる体操はBIを5改善させる しかし,実施には特別な機器が必要(一個10万円) 現実的にやる意味があるのか
Take home messages • 2次元のデータ: “関係性”や“差異”を捉えられる • 何かの効果や違いを見るには 通常は対象全員(母集団)における検証は困難 →標本から母集団を推定する • 統計的検定の意味を理解して使う 必要な条件,結果の意味 など…… • 検定はあくまで統計的な結果 臨床的意味を踏まえて解釈を