まえきんブログ

*文系出身SEが綴る、日常・趣味・体験談・スキルアップについての雑記ブログ*

【ビジネス統計スペシャリストに挑戦 #7】第7章:度数分布表

まえきんです!

ビジネス統計スペシャリスト学習・アウトプットシリーズです!

今回は第7章:度数分布表について学習しました。

【学習の全体像】※赤文字が現在位置

・ビジネスデータ把握力(平均値/中央値/最頻値/レンジ/標準偏差)

・ビジネス課題発見力(外れ値の検出/度数分布表/標準化/移動平均/季節調整)

・ビジネス仮説検証力(集計/散布図/相関分析/回帰分析/最適値)

度数分布表とは

特定のあるデータの個数(度数)をまとめて表形式にしたもの

※データのばらつきが視覚化できるようになる

度数分布表の作成(+前準備)

①階級:得られたデータを一定の値でグループ分けしたもの

②度数:データの個数

③相対度数:データ全体から見た度数の相対的な割合(度数÷度数の合計)

④累積度数:度数を最初の階級からある階級まで順に加算した値

⑤累積相対度数:相対度数を最初の階級からある階級まで順に加算した値

>>>上記①②のデータにより、ヒストグラムが作成できる

ヒストグラムとは

度数分布表のデータをグラフで表示したもの

※連続的なデータの分析に適している

※データの散らばりやまとまりかた、中心位置が

どこにあるのかを視覚化することができる

ヒストグラムでデータ分析する場合の注意点

・データの山の数

データの山の数を確認する。山が二つある場合、

異なる性質を持つデータが混在している可能性がある

・対称性

ヒストグラムが左右対称か非対称かを確認する。

左右対称の場合は検定や推定で用いる正規分布にあてはめが可能

・データの中心位置

文字通りデータの中心位置を確認する。

・ばらつき

どの程度ばらつきがあるかを確認する。

・外れ値

外れ値がないかを確認する。👈詳細は「#6:第6章 外れ値」で取り上げています

【ビジネス統計スペシャリストに挑戦 #6】第6章:外れ値の検出 - まえきんブログ (hatenablog.jp)

度数分布表・ヒストグラムの作成

f:id:maekinblog:20211002223424p:plain

f:id:maekinblog:20211002223523p:plain

【Excel操作(ヒストグラム)】※ヒストグラムの成形操作は省略

ビジネスシーンにおいても、データ全体の分布を把握するため、度数分布表を使って

整理したり、視覚的に把握するためにヒストグラムを利用するシーンが多いようです。

次回#8は「第8章:標準化」に関する知識とExcel操作について

学習・アウトプットしていきます!

最後まで読んで頂きありがとうございました!ではまた!