10.3K Views
April 01, 23
スライド概要
2023.04.01 Power BI 勉強会 #27 で清水が話したスライドです。
大学卒業後、未経験から .NET 系開発者としてソフトハウス → ITコンサルティング会社 → フリーランス → メーカー系SIerを経験。テクニカルアーキテクト。2022 年 7 月からフリーランスとして活動中。 2017 年 2 月に Microsoft MVP for Data Platform - Power BIを初受賞 (現在 6 回更新中)。Power BI 王子として認知されている。 2021 年 9 月、「Microsoft Power BI入門」(翔泳社)を出版。 最近の仕事は Power BI をエンドユーザーへ訴求 (レクチャー、研修、コンサルティング等) すること。コミュニティ活動と仕事の両面で行っている。
https://www.docswell.com/user/yugoes1021 https://www.slideshare.net/yugoes1021 BI を使うなら理解しておきたいこと ~ 最近よく聞かれること と 思うこと ~ 清水 優吾(しみず ゆうご) / テクニカル アーキテクト yugoes1021 @yugoes1021 Microsoft MVP for Data Platform - Power BI (2017.02 -) 2023-04-01 Power BI 勉強会 #27
自己紹介: MVP: プロフィールページ 清水 優吾 (Yugo Shimizu) Microsoft MVP for Data Platform – Power BI Technical Architect for BI & Data Platform https://bit.ly/PBIPrinceBook01 Data Platform をメインに活動をしている Technical Architect 個人では Powe BI 関連のレクチャーやコンサル、セミナーをやっている 専門・興味: Data Platform (Azure), Power Platform (Power BI, Power Automate, Power Apps, Power Virtual Agents) Qiita: https://qiita.com/yugoes1021 Power BI 勉強会: https://powerbi.connpass.com Microsoft MVP for Data Platform Power BI (2017.02 - ) Japan Power BI User Group: https://www.facebook.com/groups/JapanPBUG/ Japan Power Virtual Agents User Group: https://www.facebook.com/groups/JPVAUG/ YouTube: https://www.youtube.com/YugosRoom Twitter: @yugoes1021 Facebook: yugoes1021 LinkedIn: yugoes1021
今日のメニュー 1. ファクトが2つあったらどうするの? (←よく聞かれる 2. テーブルとマトリクス、区別できる? (←できてないのをよく見る
ファクトが2つあったらどうするの?
✅日付 ✅商品 📝売上📝 ✅社員 ✅得意先
✅日付 ✅商品 📝売上📝 ✅社員 ✅得意先 もし元のデータが Excel だったとするならば 元はこんな感じだったのでしょう 📝売上📝 注意:データは適当です📢
ファクトが2つあったらどうするの? スタースキーマにおいて、ファクトがひとつでなければならないという「勘違い」は たぶんこの図が原因。でもどこにもファクトがひとつでなければならないとは書いてない 参考: https://learn.microsoft.com/ja-jp/power-bi/guidance/star-schema
テーブルとマトリクス、区別できる?
日常で出会うテーブルとマトリクス 以下のようなデータがあります。 月ごとにそれぞれの製品がいくら売れているか、教えてください。
日常で出会うテーブルとマトリクス 以下のようなデータがあります。 月ごとにそれぞれの製品がいくら売れているか、教えてください。 🤔🤔🤔 こんな顔になりますよね?
日常で出会うテーブルとマトリクス 以下のようなデータがあります。 月ごとにそれぞれの製品がいくら売れているか、教えてください。
日常で出会うテーブルとマトリクス 以下のようなデータがあります。 月ごとにそれぞれの製品がいくら売れているか、教えてください。 テーブル マトリクス
日常で出会うテーブルとマトリクス 以下のようなデータがあります。 月ごとにそれぞれの製品がいくら売れているか、教えてください。 マトリクス テーブル テ ー ブ ル
テーブルとマトリクスの特徴
テーブルとマトリクスの特徴 ✅テーブル 列 行 1. 行と列がある 2. ひとつの列には同じ種類のデータが入る 3. 行方向にデータが増える(列は増えない) 1+2+3 👉 「構造化データ」である ビジュアルとしてのテーブルは、 データの一覧に向いている(一覧性が高い)
テーブルとマトリクスの特徴 ✅マトリクス 1. 2. 3. 4. 行と列があり、それぞれ階層を保持可能 行と列の一致するセルに集計値を持つ 行と列の両方向にデータが増える データが増えると以下が変化する a. b. 数値が増減 行ラベル or 列ラベルが増減 カテゴリーごとの集計値を見るのに向いている
大事なこと
大事なこと 1. ピボット(Pivot) と ピボット解除(Unpivot) 2. 一度集計した値は元の粒度に戻せない 3. データを二次利用する場合は必ずテーブル形式にする 4. Tidy data と Messy data
1.ピボット(Pivot) と ピボット解除 (Unpivot) テーブルからマトリクスへの変換 👉 ピボット (Pivot) マトリクスからテーブルへの変換 👉 ピボット解除 (Unpivot) Pivot Unpivot 集計
1.ピボット(Pivot) と ピボット解除 (Unpivot) テーブルからマトリクスへの変換 👉 ピボット (Pivot) マトリクスからテーブルへの変換 👉 ピボット解除 (Unpivot) Pivot Unpivot 集計
2.一度集計した値は元の粒度に戻せない テーブルからマトリクスへの変換 👉 ピボット (Pivot) マトリクスからテーブルへの変換 👉 ピボット解除 (Unpivot) Pivot 集計 🚫注意 一度集計してしまった値は 元の粒度に戻せない
3.データを二次利用する場合は必ずテーブル形式にする 読み込み Unpivot 保存 利用
3.データを二次利用する場合は必ずテーブル形式にする 読み込み Unpivot 保存 利用 Unpivot 読み込むデータが最初からテーブルであれば、Unpivot が不要になり、処理がひとつ減る 👉「変換は 可能な限り 上流で」
4.Tidy data と Messy data (参考) ✅Tidy data (整然データ) ✅Messy data (雑然データ) 整然(tidy)でないデータのことを Messy data と呼ぶ 📢Tidy data の定義 1. 2. 3. 4. 個々の変数(variable)が1つの列(column)をなす 個々の観測(observation)が1つの行(row)をなす 個々の観測の構成単位の類型(type of observation unit)が1つの表(table)をなす 個々の値(value)が1つのセル(cell)をなす
まとめ
まとめ データを読み込む前によぉーーーーーっく観察して、 「テーブル形式になっているか、確認をせよ」 Power Query で変換することは可能だが、 Power Query で変換することが必ずしもベストではない 一度立ち止まって考えてみるといいと思います📢