国籍別・都道府県別宿泊者数の潜在パターン:行列分解してみよう

571 Views

May 12, 25

スライド概要

Kanazawa.R #3 presentation
https://kanazawar.connpass.com/event/349762/

profile-image

Professor, University of Hyogo, Graduate School of Information Science in Kobe, JAPAN. Ph.D. in Theoretical Physics, TIT - Books: Macro-Econophysics: New Studies on Economic Networks and Synchronization, (Cambridge University Press, 2017) and Econophysics of Corporations: Statistical Life and Death in Complex Business Networks", (ibid., 2010)

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

国籍別・都道府県別宿泊者数の潜在パターン: 行列分解してみよう 藤原 義久 兵庫県立大学大学院情報科学研究科 [email protected] [email protected] | Kanazawa.R | 2025/05/10 1

2.

データ 日本政府観光局(JNTO) https://statistics.jnto.go.jp/  国籍別 都道府県別延べ宿泊者数  延べ宿泊者数は、調査対象となっている全宿泊施設からの 回答に基づき集計  観光庁「宿泊旅行統計調査(2011年〜2024年)」より、 日本政府観光局(JNTO)が作成 項目 データ数 国籍 20 都道府県 47 暦年 2011~2023 [email protected] | Kanazawa.R | 2025/05/10 2

3.

> df # A tibble: 11,562 × 4 country pref year nstays <chr> <chr> <int> <dbl> 1 Australia Aichi 2011 5670 2 Australia Aichi 2012 9600 3 Australia Aichi 2013 10380 4 Australia Aichi 2014 12710 5 Australia Aichi 2015 14500 6 Australia Aichi 2016 14190 7 Australia Aichi 2017 22080 8 Australia Aichi 2018 22350 9 Australia Aichi 2019 28580 10 Australia Aichi 2020 5460 # ℹ 11,552 more rows 新型コロナ 国籍別・都道府県別,暦年別の宿泊者数  以下では直近の2023年を対象にする [email protected] | Kanazawa.R | 2025/05/10 3

4.

宿泊者数 の絶対値 [email protected] | Kanazawa.R | 2025/05/10 4

5.

→ 絶対数から割合=パターンへ変換 都道府県ごとの国籍パターン(例) 国籍ごとの都道府県パターン(例) [email protected] | Kanazawa.R | 2025/05/10 5

6.

統計モデル~からくりを妄想 潜在パターンごとのカード20枚セット セットごとに数字の出る確率は異なる 潜在パターン2のカード 石川県の「サイコロ」 「面2が出た」 「米国が出た」 サイコロ5面=潜在パターン5つ [email protected] | Kanazawa.R | 2025/05/10 6

7.

【アイデア】 比較的少数の潜在パターンが隠れていて、データはその線形和になっているのでは? 20 countries K Ishikawa 20 47 prefectures 47 K [email protected] | Kanazawa.R | 2025/05/10 7

8.

 行列の要素は非負値  比較的疎な行列(ほぼゼロが多い) 非負値行列分解(non-negative matrix factorization) • R, P とも未知、推定することに注意 • 確率モデルと見なせる トピックモデルやLDAなどと本質的にはほぼ同じ(ベイズ推定) > library(NMF) > dim(X) # Data: prefectures by countries [1] 47 20 > K <- 5 > set.seed(123) > nmf(X, rank=K) [email protected] | Kanazawa.R | 2025/05/10 8

9.

国籍別についても同様 潜在パターンごとのカード47枚セット セットごとに数字の出る確率は異なる 潜在パターン1のカード 「東京が出た」 China の「サイコロ」 「面1が出た」 サイコロ6面=潜在パターン6つ [email protected] | Kanazawa.R | 2025/05/10 9

10.

主な結果 「台湾」(24%) 「欧米+中台」(22%) 潜在パターン 国籍「空間」 「韓国」(20%) 「中国・香港」(18%) 「東南アジア」(16%) [email protected] | Kanazawa.R | 2025/05/10 10

11.

都道府県ごとの潜在パターンへの分解(例) 1「台湾」 2「欧米+中台」 3「韓国」 4「中国」 5「東南アジア」 1「台湾」 2「欧米+中台」 3「韓国」 4「中国」 5「東南アジア」 1「台湾」 2「欧米+中台」 3「韓国」 4「中国」 5「東南アジア」 1「台湾」 2「欧米+中台」 3「韓国」 4「中国」 5「東南アジア」 [email protected] | Kanazawa.R | 2025/05/10 11

12.

都道府県ごとの 潜在パターンへの分解 [email protected] | Kanazawa.R | 2025/05/10 1「台湾」 2「欧米+中台」 3「韓国」 4「中国」 5「東南アジア」 12

13.

「東京」(30%) 「東京+京都」(24%) 「東京+北海道」(20%) 潜在パターン 都道府県「空間」 「大阪+福岡」(11%) 「東京+沖縄」(9%) 「愛知・静岡・ 山梨・千葉」(7%) [email protected] | Kanazawa.R | 2025/05/10 13

14.

国籍ごとの潜在パターンへの分解(例) 1「東京」 2「+京都」 3「+北海道」 4「大阪+福岡」 5「+沖縄」 6「愛知他」 1「東京」 2「+京都」 3「+北海道」 4「大阪+福岡」 5「+沖縄」 6「愛知他」 1「東京」 2「+京都」 3「+北海道」 4「大阪+福岡」 5「+沖縄」 6「愛知他」 1「東京」 2「+京都」 3「+北海道」 4「大阪+福岡」 5「+沖縄」 6「愛知他」 [email protected] | Kanazawa.R | 2025/05/10 14

15.

国籍ごとの 潜在パターンへの分解 1「東京」 2「+京都」 3「+北海道」 5「+沖縄」 6「愛知他」 [email protected] | Kanazawa.R4「大阪+福岡」 | 2025/05/10 15

16.

FAQ 1. 潜在パターンの数はどうやって決めるのか? → 確率モデルとして、IC, CV などのアプローチ 2. 確率モデルは正しいのか? → 観光、特に宿泊の背景知識との整合性など (例えば、空港など交通機関など) 3. 時間的な変化は? → 暦年ごとに解析して、安定性の発見や変化の検出 [email protected] | Kanazawa.R | 2025/05/10 16