回帰分析超入門

315 Views

August 06, 24

スライド概要

profile-image

コンピュータを使って色々計算しています.個人的な技術に関するメモと講義資料が置いてあります.気が向いた時に資料を修正しています. 公立小松大学臨床工学科准教授 https://researchmap.jp/read0128699

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

回帰分析超⼊⾨ 公⽴⼩松⼤学 藤⽥ ⼀寿

2.

アイスを売りたい なるべく在庫を持たずに, アイスを仕⼊れるにはどう すればよいだろう? ⼼配事 仕⼊れ量が少ない 商機を失うかも 仕⼊れ量が多い 在庫が増えるかも

3.

予測する 暑い 冷たいものがほしい 暑ければアイスが欲しくなる. 暑い⽇は多くアイスを仕⼊れよ う!!

4.

予測する 明⽇は今⽇より暑くなるから 今⽇の倍のアイスを仕⼊れよ う!! 根拠のない予測

5.

結果 やったー!! 予想通り売れまくったぞぉ!! 在庫もなし!!

6.

でもね そんなに上⼿くいかないよね

7.

予想通りにはいかない 全然売れない. 仕⼊れすぎた… えっ!? こんなに売れるの? 全然⾜りない…

8.

何が問題だったか

9.

規則性を⾒つける • 勘や当てずっぽで仕⼊れる数量を決めていませんか? 明⽇は今⽇より暑くなるから今⽇の倍 アイスを仕⼊れよう!! 根拠のない予測 • データに基づいて数量の予測をしましょう. これまでの気温のデータと販売数から, 明⽇売れる数を予測しよう.

10.

規則性を⾒つける • 勘や当てずっぽで仕⼊れる数量を決めていませんか? 明⽇は今⽇より暑くなるから今⽇の倍 アイスを仕⼊れよう!! 根拠のない予測 • データに基づいて数量の予測をしましょう. これまでの気温のデータと販売数から, 明⽇売れる数を予測しよう.

11.

データを⾒よう

12.

数値データを⾒る アイスクリームの平均購⼊額と最⾼気温などのデータ 年 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 ⽉ 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 アイスクリームの 平均湿度 ⽇最⾼気温の平均(℃) 降⽔量の合計(mm) 平均購⼊額 (%) 331 268 365 492 632 730 821 1057 724 430 363 415 351 322 367 508 667 772 1148 1080 653 434 358 388 9.3 9.9 12.7 19.2 22.4 26.6 26 29.5 28.1 21.4 17.4 13.2 10.1 12.9 14 21.3 23.7 27.5 33.1 31 28.7 20.7 19 13.4 101 53.5 159.5 121 172.5 85 187.5 370 150 171.5 229.5 53 3.5 20 129.5 69.5 149 112.5 23.5 79.5 195 780 108.5 79.5 46 52 49 61 65 69 75 73 66 59 67 50 43 45 53 51 67 66 62 65 68 69 60 49 ⽇最⾼気温25℃ 以上⽇数(⽇) 0 0 0 3 7 21 21 26 23 3 0 0 0 0 0 3 13 24 31 28 26 3 0 0 数字を⾒ても さっぱり分からん…

13.

⾒た⽬でわかるようにしよう

14.

データの可視化 年 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 ⽉ 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 アイスクリームの 平均湿度 ⽇最⾼気温の平均(℃) 降⽔量の合計(mm) 平均購⼊額 (%) 331 268 365 492 632 730 821 1057 724 430 363 415 351 322 367 508 667 772 1148 1080 653 434 358 388 9.3 9.9 12.7 19.2 22.4 26.6 26 29.5 28.1 21.4 17.4 13.2 10.1 12.9 14 21.3 23.7 27.5 33.1 31 28.7 20.7 19 13.4 101 53.5 159.5 121 172.5 85 187.5 370 150 171.5 229.5 53 3.5 20 129.5 69.5 149 112.5 23.5 79.5 195 780 108.5 79.5 46 52 49 61 65 69 75 73 66 59 67 50 43 45 53 51 67 66 62 65 68 69 60 49 ⽇最⾼気温25℃ 以上⽇数(⽇) 0 0 0 3 7 21 21 26 23 3 0 0 0 0 0 3 13 24 31 28 26 3 0 0 アイスクリームの購⼊額と気温の関係 が知りたい!! グラフにしよう!!

15.

グラフにする 座標は(最⾼気温,売上) 数値のペアを点で表したグラフを散布図という.

16.

グラフにすると分かることがある 最⾼気温と購⼊額に関 係がありそうだ!! 座標は(最⾼気温,売上)

17.

データの可視化 ⽇最⾼気 年 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2003 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 2004 ⽇最⾼気 アイスクリーム 温の平均 降⽔量の 平均湿度 温25℃以上 ⽉ の平均購⼊額 (℃) ⽇数(⽇) 合計(mm) (%) 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 331 268 365 492 632 730 821 1057 724 430 363 415 351 322 367 508 667 772 1148 1080 653 434 358 388 9.3 9.9 12.7 19.2 22.4 26.6 26 29.5 28.1 21.4 17.4 13.2 10.1 12.9 14 21.3 23.7 27.5 33.1 31 28.7 20.7 19 13.4 101 53.5 159.5 121 172.5 85 187.5 370 150 171.5 229.5 53 3.5 20 129.5 69.5 149 112.5 23.5 79.5 195 780 108.5 79.5 46 52 49 61 65 69 75 73 66 59 67 50 43 45 53 51 67 66 62 65 68 69 60 49 0 0 0 3 7 21 21 26 23 3 0 0 0 0 0 3 13 24 31 28 26 3 0 0 可視化 膨⼤な数の数値の並びでは確認しにくい数値の関 係を、グラフなどで分かりやすくする⾒えるよう にすることを可視化という.

18.

線を引いてみる

19.

線をひく データの点に基づき引かれた線のことを回帰直線という.

20.

直線をひいて何が分かる 最⾼気温から購⼊額が予測できるかも. 今⽇は25度,明 ⽇は30度の予想 だから明⽇は 1.2倍売れそう だ!! 約970円 約780円 1.2倍

21.

説明変数と⽬標変数 今⽇は25度,明 ⽇は30度の予想 だから明⽇は 1.2倍売れそう だ!! 最⾼気温から購⼊額が求まる. 最⾼気温から購⼊額が説明できる. 最⾼気温で購⼊額を説明できるので, 最⾼気温を説明変数という. 購⼊額は予測したい対象なので, ⽬標変数という.

22.

回帰 • 最⾼気温とアイスの売上の関係を直線(回帰直線)で表した. • 数値と数値の関係の式を求める問題を回帰問題という. 購⼊額 • 回帰を使ったデータの分析を回帰分析という. 気温

23.

他にも要因はなかったか?

24.

他の要因はなかったか • その他の要因は無かったですか? 明⽇は今⽇より暑くなる から今⽇の倍アイスを仕 ⼊れよう!! 根拠のない予測 • 複数の要因を検討しましょう. 湿度が低くて涼しいかも ⾬で⼈が来ないかも カープやサンフ レッチェの試合 があるかも 気温,湿度,天気,イベントなど, いろいろ考慮に⼊れないと….

25.

まとめ

26.

まとめ • データに基づいて考えることが⼤事です. • 勘ではダメ • データを可視化しましょう. • 数値だけみてもよく分かりません. • 数値の関係を直線で表そう. • 関係の強さがわかったり,数値の予測ができるかもしれません.

27.

疑問 • 直線はどうやってひくの? • 直線でいいの? • 値の⼤きさが違いすぎても⽐較できるの? • 複数要因がある場合,個別に評価してよいの? • 複数要因がある場合,どうやってそれらを同時に評価するの? • 天気やイベントの有る無しは数値では無いので,どうすれば良いの? • 数値の予測ではなく数値を分けたいときどうすればよいの? • 要因が⾮常に沢⼭ある場合はどうすればよいの?