まえきんブログ

*文系出身SEが綴る、日常・趣味・体験談・スキルアップについての雑記ブログ*

【ビジネス統計スペシャリストに挑戦 #8】第8章:標準化

まえきんです!

ビジネス統計スペシャリスト学習・アウトプットシリーズです!

今回は第8章:標準化について学習しました。

【学習の全体像】※赤文字が現在位置

・ビジネスデータ把握力(平均値/中央値/最頻値/レンジ/標準偏差)

・ビジネス課題発見力(外れ値の検出/度数分布表/標準化/移動平均/季節調整)

・ビジネス仮説検証力(集計/散布図/相関分析/回帰分析/最適値)

標準化とは

様々なデータを統計学的に見やすくする方法のことをいいます。

統計分析で扱うデータは単位や数値の大きさが異なるため、そのままでは

データ同士を比べることはできません。標準化を行うことで、単位や数値の

大きさが異なるデータ同士も比べることができるようになります。また、

標準化の計算では、平均値と標準偏差を用いてデータの平均値が0

標準偏差が1になるように変換しています。

標準化の方法

STANDARDIZE関数を使用します。

その前段階として、平均及び標準偏差を求める必要があります

平均や標準偏差は以下の記事で取り上げています。是非ご覧ください😊

【ビジネス統計スペシャリストに挑戦 #1】第1章:平均値 - まえきんブログ (hatenablog.jp)

【ビジネス統計スペシャリストに挑戦 #5】第5章:標準偏差 - まえきんブログ (hatenablog.jp)

算出時のExcel操作

f:id:maekinblog:20211003233309p:plain

上記表は支店、商品別の売上高をまとめたデータになります。

上段が標準化前、下段が標準化後のデータ一覧を示しています。

今回、商品A、B、Cは金額の単位がそれぞれ異なるため、そのままでは

統計分析上、比較対象には出来ません。そこで標準化の登場です。

まず、①AVERAGE関数で各商品の平均値を算出します。次に、②STDEV.S関数で

標準偏差を算出します。この手順で標準化に必要なデータは準備完了です。

次に標準化後のデータ一覧について、例えば支店1の商品Aの標準化した値を

算出します。それには③STANDARDIZE関数を使用します。

この関数の引数1~3は以下のように指定します。

STANDARDIZE(売上高,平均,標準偏差)

※各支店の標準化の値を求める際、平均と標準偏差のセルは1か所だけの

参照になるため、該当するセル番号は$で固定しておきます。(例)N$11,N$12

1か所値が算出できれば④オートフィルで全商品分の標準化後の値を算出します。

⑤標準化後の平均は「0」、⑥標準偏差は「1」となるのでそれぞれ固定入力します。

これにより、統計学的に比較可能な値に全て変換することができました!

👇ご参考までに、実際のExcel操作画面も録画しておきました✨

ビジネスシーンにおいては商品ごとの売り上げを比較する場合、桁や単位が異なる

場合であっても、標準化することにより散らばりを比較したり、売り上げや

価値を判断するための指標に利用されているとされています。

さて、今回の学習でようやく全体の約半分を学習したことになります。

まだまだ先は長そうですがガンバリマス😊

次回#9は「第9章:移動平均」に関する知識とExcel操作について

学習・アウトプットしていきます!

最後まで読んで頂きありがとうございました!ではまた!