>100 Views
February 10, 26
スライド概要
チュートリアルの『Assign Model』に進みます。
assign_model関数の実行
assign_model関数は、どのクラスター(Cluster 0, Cluster 1・・・)に属するかを元の入力データセットに新しい列として追加して返してくれます(クラスターラベルの付与)。
()内の引数は、create_model関数で宣言したモデルの名称を記入します。
Section22で、kmeans = create_model('kmeans')としていますので、ここでは、『kmeans』を記入しています。
Section22の参考で、下記のようなモデルを定義しましたが、その『kmeans2』を引数として記入すると、下記のスライドのようになります。
kmeans2 = create_model('kmeans', num_clusters = 3)
indexが『500』の行のクラスターが、『Cluster 3』から『Cluster 0』
へ変化しました( 『Cluster 1』も『Cluster 2』も別物ですが…)。
通常、『kmeans』、『kmeans2』等のクラスターラベルの付いたデータを使って、それぞれの平均値や最大・最小値などの要約統計量を算出すること等により、データ分析を進めていくことになります。
すべてのビジネスパーソンが意思決定プロセスにデータを活用する思考を身につけるため、まずは、データサイエンスの分析を体験していきましょう。SECIモデルの最初の段階、共同化(Socialization)からはじめていきます。 下記のブログで、ここにアップしたスライド、動画を随時、公開中です。 【ブログ】https://tutorial4datascience.blogspot.com/ 【Youtubeチャンネル】https://www.youtube.com/@DataScience_for_everyone 【Kindle】そして、このブログをまとめて書籍にしました! https://amzn.to/4ryVppn https://amzn.to/4pGgFb1
4th STEP 機械学習 Section 23 クラスタリング(4) クラスターラベルの付加 Setup Create Model Assign Model Analyze Model データサイエンス チュートリアル Prediction Save Model 1
4th STEP 機械学習 Section 23 クラスタリング(4)クラスターラベルの付加 assign_model関数の実行(1) チュートリアルの『Assign Model』に進みます。 assign_model関数は、どのクラスター(Cluster 0, Cluster 1・・・)に属するかを元の入力データセットに新しい 列として追加して返してくれます(クラスターラベルの付与)。 ()内の引数は、create_model関数で宣言したモデルの 名称を記入します。 Section22で、kmeans = create_model('kmeans') としていますので、ここでは、『kmeans』を記入しています。 データサイエンス チュートリアル 2
4th STEP 機械学習 Section 23 クラスタリング(4)クラスターラベルの付加 assign_model関数の実行(2) Section22の参考で、下記のようなモデルを定義しましたが、その 『kmeans2』を引数として記入すると、右記のようになります。 kmeans2 = create_model('kmeans', num_clusters = 3) indexが『500』の行のクラスターが、『Cluster 3』から『Cluster 0』 へ変化しました( 『Cluster 1』も『Cluster 2』も別物ですが…)。 通常、『kmeans』、『kmeans2』等のクラスターラベルの付いたデータ を使って、それぞれの平均値や最大・最小値などの要約統計量を算出 すること等により、データ分析を進めていくことになります。 データサイエンス チュートリアル 3