まえきんです!
ビジネス統計スペシャリスト学習・アウトプットシリーズです!
今回は第5章:標準偏差について学習しました。
【学習の全体像】※赤文字が現在位置
・ビジネスデータ把握力(平均値/中央値/最頻値/レンジ/標準偏差)
・ビジネス課題発見力(外れ値の検出/度数分布表/標準化/移動平均/季節調整)
・ビジネス仮説検証力(集計/散布図/相関分析/回帰分析/最適値)
標準偏差とは
データ(標本)のばらつきを表す指標
標準偏差の算出
以下2通りの方法があります。
①自分で数式を作成する
②Excel関数を使用する
これには以下2種類の関数があります。
STDEV.P関数:
Pはポピュレーション。標準偏差を求める関数。
STDEV.S関数:
Sはサンプル。データをサンプルと考え、そのデータから標準偏差を求める関数。
(Excel 2007以前のバージョンにはこのSTDEV.S関数は存在しない)
※それぞれの関数で出力される値は異なるが大きな差異がないため、
ビジネスの現場ではどちらで計算しても問題はない。
※統計学における厳密な意義を確認したい場合は理論を中心として
専門書籍(統計学検定など)を参照されると良いと思います。
私もいずれは目を通したいです✨
算出時のExcel操作
以下の月別売上高のデータを使用して、上記①、②それぞれで標準偏差を
求めるExcel操作についてみていきましょう。
①自分で数式を作成する
月、売上高(万円)の部分が元になる統計データの範囲です。
以下の手順で標準偏差を求めます。
①売上高の平均を算出
まず、元データの平均(AVERAGE関数)を求めます。そうすると平均値は
「1025」となります。
②売上高と平均売上高の差(偏差)を月別に算出
次に、偏差を求めます。売上高の平均 - 各月の売上高によって算出します。
③偏差の2乗を算出
次に、②で算出した月別の偏差の2乗を取ります。
④分散を算出
分散は③で算出した偏差の2乗の平均を取ったものです。
(上記②、③の計算はこの分散を求めるための前処理みたいなもの)
平均を取るため、使用する関数としては①と同様AVERAGE関数を使用します。
そうすると、分散は「113541.6667」となります。
⑤標準偏差を算出
ここでようやく本命である標準偏差の登場です。④で算出した値の
平方根を取ることで算出できます。使用する関数としてはSQRT関数を使用します。
そうすると、標準偏差は「336.9594437」となります。
②Excel関数を使用する
標準偏差は上記①の手順を踏むことで自力で計算して算出できますが、
実際にビジネス統計として利用するシーンとしては、手間の面からみても
こちらの②の方がはるかに出番が多いはずです。①は統計学の理論をきっちり
学びたい方にとっては必須の手順と知識となるはずですし、そうでない方も
知識として知っておいて損はないはずです✨
具体的には、
STDEV.P関数:[挿入]タブ→fx関数ボタン→STDEV.P
STDEV.S関数:[挿入]タブ→fx関数ボタン→STDEV.S
を選択します。
選択後は標準偏差の算出元であるデータ部分(B2:B13)を指定します。
STDEV.P関数による標準偏差は「336.9594437」、一方でSTDEV.S関数による
標準偏差は「351.9426606」になります。
それぞれ出力される結果の値が異なるのは、データの計算方法に違いがあるから
とされています。ビジネス統計ではこうした厳密な計算方法の詳細は取り上げられて
いないため、統計学における厳密な定義や計算方法を学びたい方は統計学の理論の
専門書を参照頂くとよいでしょう。
【Excel操作】<今回登場した統計学的概念のまとめ>
偏差:それぞれのデータとデータ全体の平均値との差
分散:偏差の2乗の平均値
標準偏差:分散の平方根
<標準偏差の数値が意味するもの>
・標準偏差が大きい=平均値から離れているデータが多い=
データのばらつき具合が大きい
・標準偏差が小さい=平均値から近いデータが多い=
データのばらつき具合が小さい
ビジネスシーンでの使いどころとしては商品の売り上げや発注、在庫管理などで
その数値のばらつきという重要な指標を求める際に使用されることが多いようです。
だんだん統計学らしい、専門チックな内容になってきましたね😊
次回#6は「第6章:外れ値の検出」に関する知識とExcel操作について
学習・アウトプットしていきます!
最後まで読んで頂きありがとうございました!ではまた!