#68 Section 23 クラスタリング(4)クラスターラベルの付加

>100 Views

February 10, 26

スライド概要

チュートリアルの『Assign Model』に進みます。

assign_model関数の実行

assign_model関数は、どのクラスター(Cluster 0, Cluster 1・・・)に属するかを元の入力データセットに新しい列として追加して返してくれます(クラスターラベルの付与)。

()内の引数は、create_model関数で宣言したモデルの名称を記入します。

Section22で、kmeans = create_model('kmeans')としていますので、ここでは、『kmeans』を記入しています。

Section22の参考で、下記のようなモデルを定義しましたが、その『kmeans2』を引数として記入すると、下記のスライドのようになります。

kmeans2 = create_model('kmeans', num_clusters = 3)

indexが『500』の行のクラスターが、『Cluster 3』から『Cluster 0』
へ変化しました( 『Cluster 1』も『Cluster 2』も別物ですが…)。

通常、『kmeans』、『kmeans2』等のクラスターラベルの付いたデータを使って、それぞれの平均値や最大・最小値などの要約統計量を算出すること等により、データ分析を進めていくことになります。

profile-image

すべてのビジネスパーソンが意思決定プロセスにデータを活用する思考を身につけるため、まずは、データサイエンスの分析を体験していきましょう。SECIモデルの最初の段階、共同化(Socialization)からはじめていきます。 下記のブログで、ここにアップしたスライド、動画を随時、公開中です。 【ブログ】https://tutorial4datascience.blogspot.com/ 【Youtubeチャンネル】https://www.youtube.com/@DataScience_for_everyone 【Kindle】そして、このブログをまとめて書籍にしました!   https://amzn.to/4ryVppn   https://amzn.to/4pGgFb1

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

4th STEP 機械学習 Section 23 クラスタリング(4) クラスターラベルの付加 Setup Create Model Assign Model Analyze Model データサイエンス チュートリアル Prediction Save Model 1

2.

4th STEP 機械学習 Section 23 クラスタリング(4)クラスターラベルの付加 assign_model関数の実行(1) チュートリアルの『Assign Model』に進みます。 assign_model関数は、どのクラスター(Cluster 0, Cluster 1・・・)に属するかを元の入力データセットに新しい 列として追加して返してくれます(クラスターラベルの付与)。 ()内の引数は、create_model関数で宣言したモデルの 名称を記入します。 Section22で、kmeans = create_model('kmeans') としていますので、ここでは、『kmeans』を記入しています。 データサイエンス チュートリアル 2

3.

4th STEP 機械学習 Section 23 クラスタリング(4)クラスターラベルの付加 assign_model関数の実行(2) Section22の参考で、下記のようなモデルを定義しましたが、その 『kmeans2』を引数として記入すると、右記のようになります。 kmeans2 = create_model('kmeans', num_clusters = 3) indexが『500』の行のクラスターが、『Cluster 3』から『Cluster 0』 へ変化しました( 『Cluster 1』も『Cluster 2』も別物ですが…)。 通常、『kmeans』、『kmeans2』等のクラスターラベルの付いたデータ を使って、それぞれの平均値や最大・最小値などの要約統計量を算出 すること等により、データ分析を進めていくことになります。 データサイエンス チュートリアル 3