まえきんです!
ビジネス統計スペシャリスト学習・アウトプットシリーズです!
今回は第7章:度数分布表について学習しました。
【学習の全体像】※赤文字が現在位置
・ビジネスデータ把握力(平均値/中央値/最頻値/レンジ/標準偏差)
・ビジネス課題発見力(外れ値の検出/度数分布表/標準化/移動平均/季節調整)
・ビジネス仮説検証力(集計/散布図/相関分析/回帰分析/最適値)
度数分布表とは
特定のあるデータの個数(度数)をまとめて表形式にしたもの
※データのばらつきが視覚化できるようになる
度数分布表の作成(+前準備)
①階級:得られたデータを一定の値でグループ分けしたもの
②度数:データの個数
③相対度数:データ全体から見た度数の相対的な割合(度数÷度数の合計)
④累積度数:度数を最初の階級からある階級まで順に加算した値
⑤累積相対度数:相対度数を最初の階級からある階級まで順に加算した値
>>>上記①②のデータにより、ヒストグラムが作成できる
ヒストグラムとは
度数分布表のデータをグラフで表示したもの
※連続的なデータの分析に適している
※データの散らばりやまとまりかた、中心位置が
どこにあるのかを視覚化することができる
ヒストグラムでデータ分析する場合の注意点
・データの山の数
データの山の数を確認する。山が二つある場合、
異なる性質を持つデータが混在している可能性がある
・対称性
ヒストグラムが左右対称か非対称かを確認する。
左右対称の場合は検定や推定で用いる正規分布にあてはめが可能
・データの中心位置
文字通りデータの中心位置を確認する。
・ばらつき
どの程度ばらつきがあるかを確認する。
・外れ値
外れ値がないかを確認する。👈詳細は「#6:第6章 外れ値」で取り上げています
【ビジネス統計スペシャリストに挑戦 #6】第6章:外れ値の検出 - まえきんブログ (hatenablog.jp)
度数分布表・ヒストグラムの作成
【Excel操作(ヒストグラム)】※ヒストグラムの成形操作は省略
ビジネスシーンにおいても、データ全体の分布を把握するため、度数分布表を使って
整理したり、視覚的に把握するためにヒストグラムを利用するシーンが多いようです。
次回#8は「第8章:標準化」に関する知識とExcel操作について
学習・アウトプットしていきます!
最後まで読んで頂きありがとうございました!ではまた!