【Power BI 初級編】うちの子って、他の子と比べて大きい?小さい?グラフで比較してみよう。

Power BI

今回は、個別データが全体の中でどの位置にあるのかをPower BIで「見える化」する方法をご紹介します。前回同様、我が子の成長データを例に、日本の発育曲線と比較したグラフを作成します。

この手法は以下のような場面でも応用できます。

  • 製品ロットの品質が、過去実績と比べてどの水準かを把握したいとき
  • 今年度の売上が、過去10年の中でどの程度のレベルか可視化したいとき

では、さっそく一緒に作ってみましょう。

この記事でできるようになること
  • 国の発育曲線(中央値・分布)を折れ線グラフに追加できるようになる
  • 網掛け領域やラベルを活用し、相対位置を直感的に伝えるグラフを作成できるようになる
  • 本記事の目的はPower BIによる「見える化」であり、実際の健康状態に関する判断は医師などの専門家にご相談ください。

仮想ケース

前回、長男の身長・体重の推移をグラフ化したところ、妻からこんなコメントがありました。

妻

わぁ、こうやって見ると安心できるわね。でも……うちの子って、「他の子と比べて大きいのかしら?小さいのかしら?」気になるわね。

ということで今回は、我が子の成長曲線に日本の発育曲線(中央値・分布)を重ねて比較してみましょう。

  • 長男の データは架空のものであり、実在の人物とは関係ありません。

データの準備

今回使用するデータは以下の3種類です。

  • 第1子の身長・体重データ(前回と同様)
  • 日数マスタ(前回と同様)
  • 国の発育曲線データ(中央値・3パーセンタイル値・97パーセンタイル値)
    • 発育曲線データは政府統計の乳幼児身体発育調査を基にExcel等で整形しておきます。元データは「0日」「30日」「0年1〜2か月未満」など不規則なため、「生後日数ごとに連続的な値へ変換(線形近似など)」しておくのがポイントです。

前回データについてはこちらの記事(リンク)をご参照ください。

体重目安データの一例👇

生後日数3%tile中央値97%tile
02.323.063.82
12.262.963.71
22.212.913.65
32.222.933.68
42.222.953.70
52.263.003.75
62.303.053.80
72.343.093.86
82.383.143.91
92.423.183.96
102.463.234.01
  • Power Queryでインポートします。(読み込み方法を知りたい場合はこちらを確認👉リンク
  • %tile: すべての観測データを小さい順に並べ、全体のうち何%目かを示す統計指標。中央値は50%tileです。

モデリング(データの接続)

Power BIでのリレーションは以下のように設定します。

  • 「生後日数」をキーに、日数マスタと体重目安テーブルを接続
  • 体重目安テーブルの「生後日数」列は、誤操作防止のため非表示に設定
  • 身長目安データも同様に接続

折れ線グラフに目安データを追加し、書式を整える

1. データの追加

❶Y軸に目安データを追加

  • 第1子データの下に、「97%tile」,「中央値」,「3%tile」を順にドラッグ&ドロップ(順序が重要)。
  • 集計方法はすべて「平均」を選択
  • 統計学的には要検討事項ですが、ここでは視覚化を優先します。

2. 「ビジュアルの書式設定」

「97%tile」の設定

❷範囲を塗る

  • 網掛け領域」にチェック
  • 設定の適用先」「系列」から「97%tile」を選択
  • カラー」を好きな色に設定し、「領域の透過性(%)」も調整

❸線を非表示にする

  • ビジュアル」→「」の「設定の適用先」「系列」から「97%tile」を選択
  • カラー」の透過性(%)」を100設定

❹マーカーを非表示にする

  • マーカー」の「設定の適用先」「系列」から「97%tile」を選択
  • このシリーズに表示」のチェックを外す
  • ❸❹では2つのやり方で線やマーカーを消しました。どちらのやり方を採っても今後の操作に影響はありません。

❺ラベルを表示

  • 系列ラベル」にチェック→「設定の適用先」「系列」から「97%tile」を選択
  • このシリーズに表示」にチェック
  • 」の「フォント」や「系列の色」を調整
  • 必要に応じて、「Y軸」から対象を選択し「この視覚エフェクトの名前変更」で名前を変更

「3%tile」の設定

❸❹❺は「97%tile」と同様

❷範囲の色を消す

  • 網掛け領域」にチェック。「設定の適用先」「系列」から「3%tile」を選択
  • カラー」は白(#FFFFFF)を選択し「領域の透過性(%)」を0に設定すると、背景を切り取ったような表示に

これで、3%tileから97%tileにかけて帯で色塗りができた。

「中央値」の設定

  • ❷網掛け不要
  • ❸線は点線など控えめに
  • ❹マーカーは非表示推奨
  • ❺ラベルは任意で表示

身長目安データについても、同様の設定をおこないます。

完成イメージ

これで、「第1子の成長曲線が全体のどのあたりに位置しているか」が一目でわかるグラフが完成しました。

まとめ

今回は、以下を学びました。

  • 国の発育曲線と比較して、個別データの相対位置を把握するグラフを作成
  • データが「全体の中でどの水準か」を直感的に伝える可視化の重要性を理解
妻

なるほど。烈(長男)が全体のどのあたりにいるか、よくわかったわ。身長はやや低めな気がするものの、体重はやや重めな感じだわね。ところで、今1歳11か月の烈の体重って、全国的にみると何歳何か月相当なのかしら?

こういった「現在の数値が、基準線のどの時点と同じくらいか?」という問いは、ビジネスでも頻出します。

ということで次回は、あるX時点でのY値が、基準線のどのX時点に相当するかを計算・可視化する方法をご紹介します。実務や日常に応用できる視点です。お楽しみに!

コメント

タイトルとURLをコピーしました