まえきんです!
ビジネス統計スペシャリスト学習・アウトプットシリーズです!
今回は第8章:標準化について学習しました。
【学習の全体像】※赤文字が現在位置
・ビジネスデータ把握力(平均値/中央値/最頻値/レンジ/標準偏差)
・ビジネス課題発見力(外れ値の検出/度数分布表/標準化/移動平均/季節調整)
・ビジネス仮説検証力(集計/散布図/相関分析/回帰分析/最適値)
標準化とは
様々なデータを統計学的に見やすくする方法のことをいいます。
統計分析で扱うデータは単位や数値の大きさが異なるため、そのままでは
データ同士を比べることはできません。標準化を行うことで、単位や数値の
大きさが異なるデータ同士も比べることができるようになります。また、
標準化の計算では、平均値と標準偏差を用いてデータの平均値が0、
標準偏差が1になるように変換しています。
標準化の方法
STANDARDIZE関数を使用します。
その前段階として、平均及び標準偏差を求める必要があります。
平均や標準偏差は以下の記事で取り上げています。是非ご覧ください😊
【ビジネス統計スペシャリストに挑戦 #1】第1章:平均値 - まえきんブログ (hatenablog.jp)
【ビジネス統計スペシャリストに挑戦 #5】第5章:標準偏差 - まえきんブログ (hatenablog.jp)
算出時のExcel操作
上記表は支店、商品別の売上高をまとめたデータになります。
上段が標準化前、下段が標準化後のデータ一覧を示しています。
今回、商品A、B、Cは金額の単位がそれぞれ異なるため、そのままでは
統計分析上、比較対象には出来ません。そこで標準化の登場です。
まず、①AVERAGE関数で各商品の平均値を算出します。次に、②STDEV.S関数で
標準偏差を算出します。この手順で標準化に必要なデータは準備完了です。
次に標準化後のデータ一覧について、例えば支店1の商品Aの標準化した値を
算出します。それには③STANDARDIZE関数を使用します。
この関数の引数1~3は以下のように指定します。
STANDARDIZE(売上高,平均,標準偏差)
※各支店の標準化の値を求める際、平均と標準偏差のセルは1か所だけの
参照になるため、該当するセル番号は$で固定しておきます。(例)N$11,N$12
1か所値が算出できれば④オートフィルで全商品分の標準化後の値を算出します。
⑤標準化後の平均は「0」、⑥標準偏差は「1」となるのでそれぞれ固定入力します。
これにより、統計学的に比較可能な値に全て変換することができました!
👇ご参考までに、実際のExcel操作画面も録画しておきました✨
ビジネスシーンにおいては商品ごとの売り上げを比較する場合、桁や単位が異なる
場合であっても、標準化することにより散らばりを比較したり、売り上げや
価値を判断するための指標に利用されているとされています。
さて、今回の学習でようやく全体の約半分を学習したことになります。
まだまだ先は長そうですがガンバリマス😊
次回#9は「第9章:移動平均」に関する知識とExcel操作について
学習・アウトプットしていきます!
最後まで読んで頂きありがとうございました!ではまた!