まえきんです!
ビジネス統計スペシャリスト学習・アウトプットシリーズです!
今回は第6章:外れ値の検出について学習しました。
【学習の全体像】※赤文字が現在位置
・ビジネスデータ把握力(平均値/中央値/最頻値/レンジ/標準偏差)
・ビジネス課題発見力(外れ値の検出/度数分布表/標準化/移動平均/季節調整)
・ビジネス仮説検証力(集計/散布図/相関分析/回帰分析/最適値)
外れ値とは
想定された範囲から大きく異なる値のこと
※発生要因:データ入力ミス、測定されたデータが
間違っている等重大な異常が隠れている可能性がある
<外れ値の扱い>
異常値を外れ値として除くか?データとして採用するか?
>>>指標となる範囲を設けることで判断する
外れ値の検出
今回は以下2つの事例について、実際にExcel操作も一緒に見ていきましょう。
事例①:散布図
【元データ】任意のデータ項目X・Yを準備します。
【散布図&外れ値の検出手順】
【Excel操作】
事例②:折れ線グラフ
【元データ】
月別の受注数をまとめたデータを準備します。
外れ値を検出する基準値として「最低基準」「最高基準」
のデータもあわせて準備しておきます。
【折れ線グラフ&外れ値の検出手順】
【Excel操作】
いずれの事例においても、各データに応じて適切な外れ値の基準を
設けるところが今回の重要なポイントです。
ビジネスシーンにおいても、仕事で扱うデータから正しい解釈を導くため、
外れ値の検出は重要な意味を持ってくるとされています。
次回#7は「第7章:度数分布表」に関する知識とExcel操作について
学習・アウトプットしていきます!
最後まで読んで頂きありがとうございました!ではまた!