まえきんブログ

*文系出身SEが綴る、日常・趣味・体験談・スキルアップについての雑記ブログ*

【ビジネス統計スペシャリストに挑戦 #6】第6章:外れ値の検出

まえきんです!

ビジネス統計スペシャリスト学習・アウトプットシリーズです!

今回は第6章:外れ値の検出について学習しました。

【学習の全体像】※赤文字が現在位置

・ビジネスデータ把握力(平均値/中央値/最頻値/レンジ/標準偏差)

・ビジネス課題発見力(外れ値の検出/度数分布表/標準化/移動平均/季節調整)

・ビジネス仮説検証力(集計/散布図/相関分析/回帰分析/最適値)

外れ値とは

想定された範囲から大きく異なる値のこと

※発生要因:データ入力ミス、測定されたデータが

間違っている等重大な異常が隠れている可能性がある

<外れ値の扱い>

異常値を外れ値として除くか?データとして採用するか?

>>>指標となる範囲を設けることで判断する

外れ値の検出

今回は以下2つの事例について、実際にExcel操作も一緒に見ていきましょう。

事例①:散布図

【元データ】任意のデータ項目X・Yを準備します。

f:id:maekinblog:20211002181758p:plain

【散布図&外れ値の検出手順】

f:id:maekinblog:20211002182221p:plain

【Excel操作】

事例②:折れ線グラフ

【元データ】

月別の受注数をまとめたデータを準備します。

外れ値を検出する基準値として「最低基準」「最高基準」

のデータもあわせて準備しておきます。

f:id:maekinblog:20211002182748p:plain

【折れ線グラフ&外れ値の検出手順】

f:id:maekinblog:20211002182951p:plain

【Excel操作】

いずれの事例においても、各データに応じて適切な外れ値の基準を

設けるところが今回の重要なポイントです。

ビジネスシーンにおいても、仕事で扱うデータから正しい解釈を導くため、

外れ値の検出は重要な意味を持ってくるとされています。

次回#7は「第7章:度数分布表」に関する知識とExcel操作について

学習・アウトプットしていきます!

最後まで読んで頂きありがとうございました!ではまた!