統計解析・確率論に関連するパラドックス

24.2K Views

April 25, 25

#統計学 #確率論 #パラドックス #シンプソンのパラドックス #バークソンのパラドックス

スライド概要

森岡裕[SASユーザー総会世話人]

@6484025

スライド一覧

SAS言語を中心として，解析業務担当者・プログラマなのコミュニティを活性化したいです

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

MMRM入門

[第8回大阪sas勉強会]

森岡裕[SASユーザー総会世話人] 46.6K

t検定の基礎(Studentのt検定とWelchのt検定)

[第9回大阪sas勉強会]

森岡裕[SASユーザー総会世話人] 32.5K

SASユーザー総会論文集 2024年

sasユーザー総会論文集 2024年

森岡裕[SASユーザー総会世話人] 26.5K

SASのコールルーチンは57個あるねん10分で全部説明するねん

[第9回大阪sas勉強会]

森岡裕[SASユーザー総会世話人] 25.1K

ゼロからでも始められるSASプログラミングのエッセンス

森岡裕[SASユーザー総会世話人] 18.8K

RTF出力を活用した解析報告書の作成

[第9回大阪sas勉強会]

森岡裕[SASユーザー総会世話人] 15.5K

各ページのテキスト

統計解析・確率論に関連するパラドックスイーピーエス株式会社森岡裕

一般に容認される前提から、反駁しがたい推論によって、一般に容認し難い結論を導く論説を逆理（パラドックスまたは逆説）という — 「逆理」日本数学会編『岩波数学辞典第4版』岩波書店、2007年（ISBN 978-4-00-080309-0）常識的見解に矛盾するように見える見解、あるいは真理に矛盾するように見えて、実はそうではない説 — 「パラドックス」青本和彦（編集）ほか『岩波数学入門辞典』岩波書店、2005年（ISBN 978-4-00080209-3）

古代ギリシャのエウブリデスのパラドックスの中の一つ．古典的なパラドックスハゲ頭のパラドックス「髪の毛が一本もない人はハゲである」（前提1）「ハゲの人に髪の毛を一本足してもハゲである」（前提2）「髪の毛を1本増やしても、ハゲであることに変わりはない。」（類推）「よって全ての人はハゲである」（結論） ※髪のある人から抜いてくパターンもありしかし，全ての人がハゲであるという結論は一般には受け入れられないなぜこんなことが起きるのか？？

パラドックスの構造正しそうに見える前提・前提の中に正しくないものがある・明示されていない前提が作用している妥当に思える推論・推論に誤りがある受け入れがたい結論・実は結論が正しい

問題点はどこか？誤りは「類推」にある漸進的な誤謬の観点で考えると・・・各ステップ（1本増加）での変化が非常に小さいことから，変化がないと「みなしてしまう」という錯覚が生じさせている「微小な変化は無視してもよい」という前提を無限に繰り返すと，現実とは乖離した結論に陥る〇少しずつの変化は無視できる → × 全体としても変化がない形式論理で考えると… 形式的には，各ステップの論理（「1本増えても変わらない」）が正しいように思えるが，「ハゲ」という概念自体が連続量に対する曖昧な言語的分類境界が明確でないため、「変わらない」という主張が無限に続けられてしまうここが、形式的推論と自然言語のギャップ

シンプソンのパラドックス

疫学調査のデータで，性別，ある治療の有無，奏効有無．男女別，治療有無別に，奏効・非奏効のデータを集計する

* データの入力; data test; length Sex Treatment Response $20.; input Sex $ Treatment $ Response $ Count; datalines; Male No Yes 4 Male No No 3 Male Yes Yes 8 Male Yes No 5 Female No Yes 2 Female No No 3 Female Yes Yes 12 Female Yes No 15 ; run; title '性別別に見た治療とレスポンスの関係'; proc sql; select Sex, Treatment, sum(case when Response="Yes" then Count else 0 end) as Response, sum(case when Response="No" then Count else 0 end) as NoResponse, calculated Response / (calculated Response + calculated NoResponse) as ResponseRate format=percent8.2 from test group by Sex, Treatment; quit; title '全体で見た治療と生存の関係'; proc sql; select Treatment, sum(case when Response="Yes" then Count else 0 end) as Response, sum(case when Response="No" then Count else 0 end) as NoResponse, calculated Response / (calculated Response + calculated NoResponse) as ResponseRate format=percent8.2 from test group by Treatment; quit;

女性について治療ありの方が奏効率が高い(40.00<40.44) 男性について治療ありの方が奏効率が高い(57.14<61.55) ↓ ×故に，治療ありの方が奏効率が高い全体でみると治療有無による奏効率の差はない (50.00 = 50.00)

10.

シンプソンのパラドックス（Simpson's paradox）統計学者エドワード・H・シンプソン， 1951年母集団での傾向と、母集団を分割した集団での傾向は、異なっている場合があるというパラドックスつまり集団を分けた場合にある仮説が成立したとしても，集団全体では正反対の仮説が成立することがある．

11.

治療の例では、性別 (C) は治療の有無 (A) と生死 (B) の共通の原因、すなわち交絡因子といえる A ← C → B この場合でいうと，コクラン・マンツェル・ヘンツェルのような層別調整の手法が使えるかもしれないただサブグループ解析がいいのか，層別解析がいいのか，全体で見たほうがいいのかは同じデータであっても因果構造によるため，常にこうして解消するというものではない提唱されたのは70年以上前だが，いまだに大きな影響をもつパラドックス

12.

バークソンのパラドックス

13.

病院の入院患者から統計的に抽出された標本を用いて、ある疾患の危険因子を調査する後方視的研究を想定ここに注目して糖尿病の半分程度が胆嚢炎を罹患しているので，この2つには関係があると考えるのは間違い

14.

糖尿病を持たない入院患者は、糖尿病以外の入院理由（胆嚢炎の原因になるかもしれない）があるから、一般人に比べて胆嚢炎になる可能性が高いと考えられるこの結果は、一般人口において糖尿病と胆嚢炎の間に関連性があるかどうかに関わらず、得られるものである

15.

たとえばである有名人（人気ユーチューバーとか）縦軸に才能スコア，横軸に魅力スコア（どうやって測るかはともかく）をとると負の相関のようにみえるつまり魅力がある人ほど，才能がない

16.

才能か人間的魅力が大きい人が有名になりがちと考えられる ↓ その有名人の集団を切り取ってみると，仮に左図のように才能と魅力が無相関でも右図のように相関関係が生じているかのようにみえる

17.

バークソンのパラドックス（Berkson‘s paradox）物理学者、医師、統計学者ジョセフ・バークソン， 1946年観察研究における選択バイアス，確認バイアスの問題に起因するパラドックス事象AまたはBの下で事象Aが起こる条件付き確率はどちらも起こらない場合を除外しているため、事象A自体の確率よりも高くなる AまたはBにおける、Bの下でのAの条件付き確率が母集団での条件付き確率と等しいときにパラドックスが生じる AまたはBにおける、Aの無条件確率は、母集団全体での無条件確率と比べて高いので、AまたはBにおいて、Bが存在することでAの条件付き確率が減少する ⇒ 全体の無条件確率に戻る A B 合流点 Collider 統計学や因果グラフにおいてある変数が2つ以上の変数から因果的な影響を受けている場合，その変数は合流点といわれる合流点に影響を与える因果変数同士は、相互に関連しているとは限らない

18.

誕生日のパラドックス

19.

「何人集まれば、その中に誕生日が同一の2人（以上）がいる確率が、50%を超えるか?」その問いの答えは理論的には 23人なのですが，それが一般人の直観に反するというパラドックス 2人目が1人目と異なっている誕生日である確率は、364/365 ．次に、3人目が1人目2人目と異なる誕生日である確率は 363/365 である n人目は (365-n+1)/365 となる。つまり、n人の誕生日が全て異なる確率を考えて，それを1から引いて出せる /* 1〜100人の理論値を計算 */ data birthday_plot; do n = 1 to 100; p_no_match = 1; do k = 1 to n-1; p_no_match = p_no_match * (1 - k / 365); end; p_match = 1 - p_no_match; output; end; run; /* グラフ描画 */ proc sgplot data=birthday_plot; series x=n y=p_match / lineattrs=(color=red thickness=2); refline 0.5 / axis=y lineattrs=(pattern=shortdash) label="50%"; refline 23 / axis=x lineattrs=(pattern=shortdash) label="23"; xaxis label="Number of people" grid; yaxis label="Probability of a pair" grid; title "Probability of at least one shared birthday in a group"; run;

20.

モンテカルロ・シミュレーションで，独立した誕生日（双子とかじゃい）をもつ23人を集めておんなじ誕生日がいるかを確認するって儀式を1万回繰り返して，いた data birthday_sim; call streaminit(123); /* 乱数の初期化（再現性のため） */ 回数を1万でわって，確率をだしてみる．理論的には約 do sim = 1 to &n_sim; 50.7%になるはずだが，実際どうだ？？ %let group_size = 23; %let n_sim = 10000; /* グループの人数 */ /* シミュレーションの回数 */ array bday[&group_size]; do i = 1 to &group_size; bday[i] = ceil(365 * rand("uniform")); /* 1〜365の誕生日 */ end; /* 重複チェック */ same_birthday = 0; do i = 1 to &group_size-1 until (same_birthday = 1); do j = i+1 to &group_size; if bday[i] = bday[j] then same_birthday = 1; end; end; 50.8%となり，ほぼ理論値どおりの結果 output; end; run; proc means data=birthday_sim mean; var same_birthday; title "誕生日が一致する確率（&group_size 人中、&n_sim 回のシミュレーション）"; run;

21.

なぜ，誕生日のパラドックスが人間にとって，直観に反して人間以外にきいてみようパラドックス足りえるのか？？

22.

23.

24.

25.

26.

モンティホールパラドックス

27.

あるテレビ番組で，あなたはクイズに勝ち、，3つのドアのうち1つを選ぶ権利を得ました。 3つのドアのうち、1つには「車（当たり）」、他の2つには「ヤギ（ハズレ）」が隠されています。

28.

あなたが一つのドアを選択します

29.

あなたが選ばなかった2つのドアのうち，１つを司会者があけて，そこにヤギ（はずれ）がいることを見せますそしてドアを選びなおしてもいいですよ．この時，選択を変えない場合と変えた場合，どちらが得か？

30.

正解は『ドアを変更する』なぜなら、ドアを変更した場合には景品を当てる確率が2倍になるから詳しくはwikipediaでモンティホール問題でみてもらえればですが，これはアメリカで大論争を巻き起こしました．確率論から導かれる結果を説明されても、なお納得しない者が少なくないことから、モンティ・ホール・ジレンマ、モンティ・ホール・パラドックスとも称される。「直感で正しいと思える解答と、論理的に正しい解答が異なる問題」つまり，実は結論は正しいパターンのパラドックス

31.

1. 最初の選択で車を当てている確率は 1/3 なぜなら、プレイヤーはランダムにドアを選んでいるため： •ドア①に車がある確率 → 1/3 •ドア②に車がある確率 → 1/3 •ドア③に車がある確率 → 1/3 2. 最初の選択でヤギを選んでいる確率は 2/3 •ドア①がヤギ（失敗）である確率 → 2/3 このとき、モンティは必ず「もう1つのヤギのドアを開ける」ので、残ったドア（＝選ばなかった＆開けられなかったドア）には車がある確率が2/3となります •このように、「最初に正解していた場合（1/3）」だけが、選び直すと損。 •それ以外の「最初に間違っていた場合（2/3）」は、選び直すと当たる。結論：選び直すことで当たる確率は 2/3。

32.

最初の選択が正解である確率：1/3 → 変更すると損最初の選択が不正解である確率：2/3 → 変更すると得よって、選択を変更するほうが2倍の確率で当たるモンティが必ずヤギのドアを開けるというルールがあるため、プレイヤーの行動に「バイアスされた情報」が加わるこれがただの運任せ（モンティが無作為に開ける）とは全く違う点であり、「条件付き確率」が成立する決定的な理由となる

33.

大数学者ポール・エルデシュはこの説明をうけても納得しなかった弟子のアンドリュー・ヴァージョニが、本問題を自前のパーソナルコンピュータでモンテカルロ法を用いて数百回のシミュレーションを行って，変えたほうが得になることを証明し，エルディッシュが納得したというエピソードがあるのでアンドリュー・ヴァージョニに倣ってシミュレーションで考えてみる当時はコンピューター性能的に数百回だったそうですが，私たちは贅沢に100万回まわしてみましょうか

34.

/* シミュレーション回数 */ %let num_simulations = 1000000; data monty_hall_simulation; do simulation_id = 1 to &num_simulations; /* 1. 車のドアをランダムに決定 (1, 2, 3) */ car_door = ceil(3 * ranuni(0)); /* 2. 参加者が最初に選ぶドアをランダムに決定 */ initial_choice = ceil(3 * ranuni(0)); /* 3. モンティがヤギのドアを開ける */ /* 参加者の選択と新車のドア以外のドアを選ぶ */ do monty_opens = 1 to 3 until (monty_opens ne initial_choice and monty_opens ne car_door); end; /* 4. ドアを変更する場合の選択 */ /* 最初の選択とモンティが開けたドア以外のドアを選ぶ */ do switch_choice = 1 to 3 until (switch_choice ne initial_choice and switch_choice ne monty_opens); end; output; proc sql ; end; title "ドアを変更した場合の的中率"; keep initial_choice switch_choice car_door; select mean(switch_choice = car_door) run; into :win_rate_switch from monty_hall_simulation; title "ドアを変更しない場合の的中率"; select mean(initial_choice = car_door) into :win_rate_stay from monty_hall_simulation; quit;

35.

ドアを変更するという行為は、最初の「2/3の確率でハズレを選んでいた」という事象に賭け直すことになるので，変えたほうが得ということが実際，プログラムにしてみて，私は初めて理解できた．プログラムでのパラドックスの検証は私はとても有用だと思います

36.

ロードのパラドックス

37.

[beta]

たとえば，ダイエット療法における体重変化を男女で比較したい場合を考える
ダイエット開始前の体重と後の体重と性別があるとして
data weight_data;
length sex $20.;
call streaminit(67890);

/* データ生成 */
/* 男子グループ */
do sex = "Male";
do i = 1 to 100;
/* PreとPostは相関0.8の多変量正規分布に従う */
z1 = rand('NORMAL', 0, 1);
z2 = rand('NORMAL', 0, 1);
pre_weight = 70 + 5 * z1; /* Pre: 平均70kg、SD=5 */
post_weight = 72 + 5 * (0.8 * z1 + sqrt(1 - 0.8**2) * z2); /* Post:
平均72kg、相関0.8 */
diff_weight = post_weight - pre_weight;
output;
end;
end;
/* 女子グループ */
do sex = "Female";
do i = 1 to 100;
z1 = rand('NORMAL', 0, 1);
z2 = rand('NORMAL', 0, 1);
pre_weight = 60 + 5 * z1; /* Pre: 平均60kg、SD=5 */
post_weight = 62 + 5 * (0.8 * z1 + sqrt(1 - 0.8**2) * z2); /* Post:
平均62kg、相関0.8 */
diff_weight = post_weight - pre_weight;
output;
end;
end;
drop z1 z2 i;
run;

38.

2つの分析法を行う /* 分析1：差の分析（体重変化の比較） */ proc ttest data=weight_data; class sex; var diff_weight; title '差の分析：体重変化（Post - Pre）のグループ間比較'; run; /* 分析2：共分散分析（ANCOVA） */ proc glm data=weight_data; class sex; model post_weight = sex pre_weight / solution; lsmeans sex / adjust=tukey; title '共分散分析：Preを共変量としたPostのグループ間比較'; run; quit;

39.

t検定共分散分析

40.

ロードのパラドックス（Lord's paradox ）統計学者フレデリック・マザー・ロード， 1967年統計学者が既存の差異を調整するかどうかによって異なる結論に達する可能性がある例をパラドックスとして示した先の例としては単純な変化量分析であれば有意にならず，ベースラインを調整した共分散分析では有意になった変化量分析は個々の参加者の変化そのものに注目していて共変量分析は初期値が同じであったとした場合に、最終値に差があるかどうかに注目しているこれも，昨今の因果推論の枠組みの中でいまだホットな議論になっている．一番最初に説明したシンプソンのパラドックスの連続量版に近いという見方もある

41.

平均への回帰あんまりパラドックスとはいわない，ただの現象だけどロードのパラドックスに絡んでるので一応

42.

1000人の参加者について，ある評価をして，スコアをとります（その評価の母平均は100で，標準偏差は 15だとします）．人間なので，測定ごとに，その人の本来のスコアにノイズが入るとします得られたスコアのうち，1回目のスコアで，上位5%の高得点集団と下位5%の低得点集団を定義してみます %let n = 1000; /* 真のスコアとノイズを作成し、1回目と2回目の観測スコアを生成 */ data regression_to_mean; /* 観測値のパーセンタイル（5%と95%）を計算 */ call streaminit(123); proc univariate data=regression_to_mean noprint; do id = 1 to &n; var observed1; output out=percentiles pctlpre=P_ pctlpts=5 /* 真のスコア（平均100, SD=15） */ 95; true_score = rand("normal", 100, 15); run; /* ノイズを加えた1回目と2回目の観測スコア */ noise1 = rand("normal", 0, 10); observed1 = true_score + noise1; noise2 = rand("normal", 0, 10); observed2 = true_score + noise2; output; end; run; data regression_to_mean; if _n_ = 1 then set percentiles; set regression_to_mean; if observed1 >= P_95 then high = 1; else high = 0; if observed1 <= P_5 then low = 1; else low = 0; run;

43.

1回目のスコアの高得点集団の２回目のテストは前より低くなり 1回目のスコアの低得点集団の２回目のテストは前より高くなるグラフの回帰直線は、完全な y=x の直線より傾きが小さく、これも「極端な値が平均に戻る」傾向を示している

44.

ウィル・ロジャース現象

45.

もしオクラホマ州の出稼ぎ労働者がカリフォルニア州に移動したら、両方の州の知的レベルが上がるだろうアメリカ合衆国のコメディアンであるウィル・ロジャースが、 1930年代の世界恐慌の際に言ったコメントが由来．現代でこれ言ってたら一発NGレベルな問題発言っぽいが．つまりある集合の中の数を別の集合に移した結果、両方の平均が高く（低く）なる現象のことであるこの現象は、次の2つの条件がともに成り立つ時に起こる移動する要素は移動前の集合の平均よりも小さい。移動する要素は移動先の集合の平均よりも大きい。

46.

Aにおけるスコア60は Aの平均より高く Bの平均より小さいこれがAからBに動くと両群の平均が下がる /* 平均の確認（初期状態） */ proc means data=initial mean; class Group; var Score; title "Initial Group Means"; run; /* Step 2: スコアが 60 の人を Group A から B に移動 */ data moved; set initial; if Group="A" and Score=60 then Group="B"; run; /* 平均の確認（移動後） */ proc means data=moved mean; class Group; var Score; title "Group Means After Moving Score=60 from A to B"; run;

47.

ウィル・ロジャース現象は実際の医療データで起きているグループ Healthy（診断前・健康）と Cancer（診断済み）に分類。診断技術（例：FDG-PETスキャン）の向上により、「境界的な人（移行期）」が Healthy → Cancer に再分類される。結果的に、両グループの平均寿命が向上して見える。診断技術が発達してこの，今まで健康人扱いだった寿命65年の患者が癌患者と判定されるようになった場合カテゴリーの付け替えによって健康人も，癌患者も平均寿命が延びるなにも変わってないのに，検査精度があがっただけで寿命が延びている錯覚を起こす

48.

両グループの平均寿命が上がったように見える → 診断が良くなっただけで、実際に寿命が延びたわけではない。ウィル・ロジャース現象は疾患の評価法や，診断基準が変わった場合に起きうるので，オンコロジー領域などでの評価・診断法変更時には要注意ステージマイグレーションのパラドクスともいうらしい

49.

生物統計も確率論も関係ないけど… おまけアキレスと亀のパラドックス

50.

ゼノンのパラドックスの一つ走ることの最も遅いものですら最も速いものによって決して追い着かれないであろう。なぜなら、追うものは、追い着く以前に、逃げるものが走りはじめた点に着かなければならず、したがって、より遅いものは常にいくらかずつ先んじていなければならないからである •初期設定: •アキレスの速度 = 10 m/s、亀の速度 = 1 m/s •亀はスタート時に 100m 先にいる •ロジック: •各ステップで、アキレスは亀のその時点での位置に追いつくのに必要な時間を計算 •その時間だけ進んだときの両者の位置を更新 •この繰り返しは、理論的には無限に続くが、ここでは15ステップで打ち切る •結果: •アキレスがいくら進んでも、常に亀が先にいる

51.

/* ゼノンのステップを計算: アキレスが亀のいた位置に到達する点 */ data zeno_steps; /* 初期条件 */ v_a = 10; v_t = 1; d = 100; /* 最初の15ステップを計算 */ do step = 0 to 15; /* ステップnでの時間: t_n = d / (v_a - v_t) * (1 (v_t/v_a)^n) */ time = (d / (v_a - v_t)) * (1 - (v_t / v_a)**step); /* アキレスの位置 */ achilles_pos = v_a * time; /* 亀の位置 */ tortoise_pos = d + v_t * time; /*アキレスと亀の距離*/ diff=tortoise_pos-achilles_pos; output; end; format diff 30.28; run;

52.

限りなく 0 に近づくが，けっして逆転できない

53.

追い越せることは自明なので，それにどう説明をつけて解消するか /* データセットの作成: 時間ごとのアキレスと亀の位置 */ data zeno_paradox; /* 初期条件 */ v_a = 10; /* アキレスの速度 (m/s) */ v_t = 1; /* 亀の速度 (m/s) */ d = 100; /* 亀の初期位置 (m) */ /* 時間軸: 0秒から12秒まで0.1秒刻み */ do time = 0 to 12 by 0.1; /* アキレスの位置: x_a = v_a * time */ achilles_pos = v_a * time; /* 亀の位置: x_t = d + v_t * time */ tortoise_pos = d + v_t * time; output; end; run;

54.

総合的な解消のポイントゼノンのパラドックスは、無限の概念や連続性の直感的な理解が未熟だった時代に、運動や分割の不可能性を強調するために作られた。これらは現代数学・物理学で次のように解消される 1.無限級数の収束: 無限に分割された距離や時間も、数学的に有限の値に収束する。 2.微積分学: 無限小の概念を扱うことで、連続的な変化を正確に記述。 3.空間と時間の連続性: 物理学的に、空間と時間は無限分割の概念を超えて連続的に存在。「無限の回数が無限の時間で行われる」この実際にはおかしい論理を（わざと）自然に仕込ませている点がこのパラドックスを成立させている

55.

まとめ統計解析におけるパラドックスの重要性への所感

56.

統計的思考の深化パラドックスを理解することで、「数字」だけでなく、その背景や条件を考慮する統計的思考が養われる科学的判断の精度向上パラドックスを通して、「何がデータから本当に言えるのか？」という視点が得られる前提・推論・結果の解釈のいずれかに誤解や見落としがないかを考えることは解析の計画段階，実施段階，結果の考察どの段階においても重要になる教育や啓発への応用パラドックスは，初学者から専門家まで幅広く使える教材となりえるクイズ形式で導入することで興味を引き、データの「意味」を深く理解させるきっかけになる

57.

ご清聴ありがとうございました！