#68 Section 23 クラスタリング（４）クラスターラベルの付加

>100 Views

February 10, 26

#機械学習 #クラスタリング #クラスターラベル #assign_model #データ分析

スライド概要

チュートリアルの『Assign Model』に進みます。

assign_model関数の実行

assign_model関数は、どのクラスター（Cluster 0, Cluster 1・・・）に属するかを元の入力データセットに新しい列として追加して返してくれます（クラスターラベルの付与）。

（）内の引数は、create_model関数で宣言したモデルの名称を記入します。

Section22で、kmeans = create_model('kmeans')としていますので、ここでは、『kmeans』を記入しています。

Section22の参考で、下記のようなモデルを定義しましたが、その『kmeans2』を引数として記入すると、下記のスライドのようになります。

kmeans2 = create_model('kmeans', num_clusters = 3)

indexが『500』の行のクラスターが、『Cluster 3』から『Cluster 0』
へ変化しました（『Cluster 1』も『Cluster 2』も別物ですが…）。

通常、『kmeans』、『kmeans2』等のクラスターラベルの付いたデータを使って、それぞれの平均値や最大・最小値などの要約統計量を算出すること等により、データ分析を進めていくことになります。

猫のタロー

@Cat_Taro

スライド一覧

すべてのビジネスパーソンが意思決定プロセスにデータを活用する思考を身につけるため、まずは、データサイエンスの分析を体験していきましょう。SECIモデルの最初の段階、共同化（Socialization）からはじめていきます。下記のブログで、ここにアップしたスライド、動画を随時、公開中です。【ブログ】https://tutorial4datascience.blogspot.com/ 【Youtubeチャンネル】https://www.youtube.com/@DataScience_for_everyone 【Kindle】そして、このブログをまとめて書籍にしました！　　https://amzn.to/4ryVppn 　　https://amzn.to/4pGgFb1

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

データサイエンス関連資格

猫のタロー 49.8K

データサイエンス関連の資格_後編

猫のタロー 4.2K

データサイエンス関連資格_前編

猫のタロー 2K

#73 【解決編】 PythonとPyCaretのバージョン問題

猫のタロー 1K

#32 NDBオープンデータとは

猫のタロー 650

#33 URLからデータを読み込む

猫のタロー 423

各ページのテキスト

4th STEP 機械学習 Section 23 クラスタリング（４）クラスターラベルの付加 Setup Create Model Assign Model Analyze Model データサイエンスチュートリアル Prediction Save Model 1

4th STEP 機械学習 Section 23 クラスタリング（4）クラスターラベルの付加 assign_model関数の実行(1) チュートリアルの『Assign Model』に進みます。 assign_model関数は、どのクラスター（Cluster 0, Cluster 1・・・）に属するかを元の入力データセットに新しい列として追加して返してくれます（クラスターラベルの付与）。（）内の引数は、create_model関数で宣言したモデルの名称を記入します。 Section22で、kmeans = create_model('kmeans') としていますので、ここでは、『kmeans』を記入しています。データサイエンスチュートリアル 2

4th STEP 機械学習 Section 23 クラスタリング（4）クラスターラベルの付加 assign_model関数の実行(2) Section22の参考で、下記のようなモデルを定義しましたが、その『kmeans2』を引数として記入すると、右記のようになります。 kmeans2 = create_model('kmeans', num_clusters = 3) indexが『500』の行のクラスターが、『Cluster 3』から『Cluster 0』へ変化しました（『Cluster 1』も『Cluster 2』も別物ですが…）。通常、『kmeans』、『kmeans2』等のクラスターラベルの付いたデータを使って、それぞれの平均値や最大・最小値などの要約統計量を算出すること等により、データ分析を進めていくことになります。データサイエンスチュートリアル 3