#38 分析の準備

>100 Views

September 26, 24

スライド概要

さて、いよいよNDBデータから作成した分析用のデータを分析していきます。

今回は、次のような順番で分析の準備を整えていきましょう。

1.分析用ノートブックの作成
2.データの読み込み
3.データ型の確認
4.「医薬品名」ごとの薬価を示す列の追加


************

★この動画のブログ

■ データサイエンス チュートリアル
https://tutorial4datascience.blogspot.com/

profile-image

すべてのビジネスパーソンが意思決定プロセスにデータを活用する思考を身につけ、ブルシットジョブをこの世からなくしていきましょう!

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

1 3rd STEP 応用編 医療 Section 7 分析の準備

2.

2 Section 7 分析の準備 1.分析用ノートブックの作成 前のSection6までで作成した「naihuku.csv」を分析していきます。データの読み込みに時間 がかかりますので、分析用の新たなノートブックを作成しましょう。名称は、「分析」と名付けます。

3.

3 Section 7 分析の準備 2-1.データの読み込み ライブラリPandas、NumPyをインポートし、データ型に気を付けながら「naihuku.csv」 を読 込んだものを「df0」と宣言します。 その際、列名「薬効分類」、列名「都道府県番号」はまずは「int(整数型)」で読み込みま す。 その後、列名「薬効分類」、列名「都道府県番号」は、データ型を「str(文字列型)」に再変 換し、「df1」と宣言します。 これで、前のSection6で小数点が付いていた列名「薬効分類」、列名「都道府県番号」は、 小数点以下が無くなっていることと思います。 次ページの画面イメージ画像をご覧ください。

4.

4 Section 7 分析の準備 2-2.データの読み込み

5.

5 Section 7 分析の準備 3.データ型の確認 念のため、データ型を確認しておきましょう。 「dtypes」を使うと右記のように、データ型を確 認できます。 データ分析のためのデータが出来上がりました。

6.

6 Section 7 分析の準備 4.「医薬品名」ごとの薬価を示す列の追加 次に、それぞれの行ごと、すなわち「医薬品名」ごとの「薬価」を算出した列「金額」を追加し ましょう。分析の時に、医薬品名毎の金額で分析を進めるためです。 さあ、準備が整いました。次のSectionからは、分析を始めていきます。