#42 後発品比率の都道府県別年度推移

>100 Views

January 31, 25

スライド概要

いよいよ3rd STEPの最終回です。

前のSectionでは、令和2年度の都道府県別の薬剤費総額と対10万人当たりの薬剤費のグラフを同一画面で描画しました。日本では、医療費削減のために後発品(ジェネリック医薬品とも言います)の使用が推奨されています。そこで、薬剤費をドリルダウンして、後発品とその他に分け、金額ベースの後発品比率を求めていきます。

特に新しいプログラムはないのですが、今まで出てきたプログラムを思い出して復習していきましょう。

************

★この動画のブログ

■ データサイエンス チュートリアル
https://tutorial4datascience.blogspot.com/

★参考資料

■ オープンデータを使った論文
https://icer.tokyo/materials/ndb_opendata_replication/

■ 一般社団法人日本薬剤疫学会
https://www.jspe.jp/

profile-image

すべてのビジネスパーソンが意思決定プロセスにデータを活用する思考を身につけ、ブルシットジョブをこの世からなくしていきましょう!

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

1 3rd STEP 応用編 医療 Section 11 後発品比率の都道府県別年度推移 前のSectionでは、令和2年度の都道府県別の薬剤費総額と対10万人 当たりの薬剤費のグラフを同一画面で描画しましたが、ここでは、年度別× 都道府県別の推移をグラフ化していきます。

2.

2 Section 11 後発品比率の都道府県別年度推移 今まで出てきたデータの概要をまとめました kenbangou→小次郎が作成した「都道府県番号マスタ」の「都道府県番号」のデータ 型を整数に替えたもの df0→「naihuku.csv」を読み込んだデータ df1→df0の「薬効分類」、「都道府県番号」を文字列に変換したデータ df2→「金額(薬価×個数)」を追加したデータ df3→「年度」の「R2」だけを抽出したデータ df4→df3(R2のみのデータ)を「都道府県番号」ごとに「金額」を集計したデータ df5→df4に「都道府県」名を追加し、「都道府県番号」でソートしたデータ pop→e-Statで見つけた都道府県別人口(R2)のデータを読み込んだデータ pop2→「pop」から都道府県の人口だけを抽出したデータ pop3→「pop2」から都道府県番号を作成したデータ pop4→「pop3」の都道府県番号を整数にしたデータ pop5→「pop4」から「都道府県番号」と「人口」のみを抽出したデータ df6→「df5」と「pop5」をマージしたデータ df7→「df6」に「対10万人」当たりの薬剤費を追加したデータ

3.

3 医療費を下げるため後発品(ジェネリック医薬品)の使用が推奨されています。 そこで、都道府県別に、薬剤費に占める後発品比率を求めていきましょう。 まずは、8年間分を合計した後発品比率を求め、その後年度ごとの推移を グラフ化していきます。都道府県別にみた場合、すべての都道府県で 後発品比率が上がってきているのか確認していきます。

4.

4 Section 11 後発品比率の都道府県別年度推移 1.全期間のデータを作成(1) 8年間の後発品比率の年度ごとの推移を見るためのデータ「df2」に、「都道府県番号」の 列を追加します。 df2をコピーして、 「91 pd.merge」を使い、「kenbangou」と結合します。その際、後に グラフ化した際に都道府県の順番を整えるために、あらかじめ「都道府県番号」は整数 (int)にしておきます。

5.

5 Section 11 後発品比率の都道府県別年度推移 2.全期間のデータを作成(2) 出来上がったデータは、下記のようになります。

6.

6 Section 11 後発品比率の都道府県別年度推移 3.全期間のグラフ(1) seabornを使って、グラフ化します。 信頼区間を示す「errorbar」は、見にくいので、表示しないように指示しておきます (errorbar=None)。

7.

7 Section 11 後発品比率の都道府県別年度推移 4.全期間のグラフ(2) seabornを使って、グラフ化した結果は、下記のようなグラフになります。NDBオープンデータ の解説を読むと「0」は後発品以外、「1」は後発品を示していることがわかります。

8.

8 Section 11 後発品比率の都道府県別年度推移 5.年度ごとの集計表 「df9」を使って、年度ごとの「後発品以外(0)」、「後発品(1)」の薬剤費を都道府 県ごとに集計したクロス集計表(「df10」)を作成します。 「表側」、すなわち、「まとめる」項目に「都道府県」、「都道府県番号」、「年度」 「表頭」すなわち、「分割」する項目に「後発品区分」 「計算する値」に「金額」 「関数」に合計値を求める「sum」を指定します。 「reset_index()」を使い、indexも振り直します。

9.

9 Section 11 後発品比率の都道府県別年度推移 6.後発品比率を追加 「df10」に、「後発品比率」の列を追加したものを「df11」と宣言します。 後発品区分 0:後発品以外 、1:後発品 indexが降られ ているだけなので この列は無視し ます。 47都道府県×8年間=376行

10.

10 Section 11 後発品比率の都道府県別年度推移 7.都道府県番号でソート グラフにしたときに見やすいように、都道府県番号でソートします。 indexが降られ ているだけなので この列は無視し ます。

11.

11 Section 11 後発品比率の都道府県別年度推移 8.年度ごとの後発品比率のグラフを作成(1) seabornの「lineplot」を使って、都道府県ごとの後発品比率の推移をグラフ化します。この際、 「hue」に年度を指定すると一つの折れ線が一つの年度を示すグラフになります。

12.

12 Section 11 後発品比率の都道府県別年度推移 9.年度ごとの後発品比率のグラフを作成(2) 実行して、グラフを描画させます。 グラフを見ると、どの都道府県でも、毎年、後発品比率が上昇していることがわかります。また、よく 見ると、少しづつ後発品比率の上昇率が少なくなっていることが見えてくるでしょう。

13.

13 Section 11 後発品比率の都道府県別年度推移 10.NDBオープンデータの限界 NDBオープンデータの薬剤データに関しては、すべての薬剤が掲載されているわけではなく、 第1回は3桁の薬効分類ごとに使用実績の多い薬剤上位30位まで、それ以降は上位 100位までしかデータがありません。 そのため、後発品比率も全薬剤の数値と異なっています。 また、新聞などで取り上げられる後発品比率は個数で算出されることが多く、本チュートリ アルのように薬剤費(金額)ベースでの数値ではありません。大人の事情があるようです が、この状況で分析の深堀りをすることは意味を成しません。 第3部の目的は、オープンデータが格納されているURLからデータを取り出し、各種マ スタを付け加えて分析用のデータを作成し、インサイト(洞察)を得るためにグラフ化す ることですので、第3部はここで終了とします。 NDBオープンデータは貴重なデータですが、その元になっているNDBは、審査が通れば大 学等の研究機関では利用が可能です。患者の病歴ごとの分析等が可能になります。部 分的にオープンデータを使った論文の例も増えているようですが、 元データであるNDBを 活用したデータ研究の詳細は、 一般社団法人日本薬剤疫学会のホームページを参照、 入会することをお勧めします。