代表値

代表値

さあ、統計学の勉強を始めていきましょう。

統計学とは、大量の資料(データ)から傾向を読んだり、特徴を読み取ったりするための手法を学ぶものです。

例えば、ある店舗の商品の売り上げの情報を、ただそのままにしておくだけでは、どの商品が売れ筋なのか、人気のない商品が何かなどは分かりません。

実際に直接販売している店員は、感覚として売れ筋を把握しているかもしれません。しかし、それを他の人(上司や本部)に知らせるには、感覚では伝えようがないですよね。人に伝えるためにも、データを分析することが必要です。

そこで、売り上げた商品のデータをまとめて、どのような傾向があるかを知ることで、次の商品の入荷量を決めたり、新商品の売れ筋を予測したりするといったマーケティングに活かすことができます。

それではさっそく、実際にデータを分析する手法について学んでいこう。

下の表は、あるクラスでのテストの結果である。

生徒 A B C D E F G H I J
得点 77 84 52 63 70 63 77 67 77 84

ここでの売上数のように、さまざまな値を取る数値のことを変量といいます。

テストの結果では、自分の点の次に気になるものとして平均点がありますね。中には、最高点、最低点などの値を知りたがる人もいるでしょう。これらのような資料全体の特徴を表す数値のことを、代表値といいます。

名前からその人の点を見るには、名前をアイウエオ順(今はアルファベット順ですが)などにした今の表が見やすいが、データを読み取るには変量がある規則に従って並んでいた方が便利です。

そこで、変量が小さい値から大きい値になるように並び替えてみましょう。この操作のことをソートといいます。

では実際に先ほどのデータを得点の低い方からソートしてみます。

生徒 C D F H E A G I B J
得点 52 63 63 67 70 77 77 77 84 84

このように並び替えると、最低点が52点、最高点が84点であることなどが手に取るように分かりますね。

さて、データを見やすくしたところで、次は具体的な代表値を見ていきましょう。代表値には次のようなものがあります。

■定義(代表値)

  • 最大値
    変量の値の中で最大のもの。
  • 最小値
    変量の値の中で最小のもの。
  • 平均値
    変量の値の総和を、データの数で割ったもの。
  • 中央値(メジアン)
    資料を変量の大きさの順に並べたときの中央の値。データの個数が偶数のときは中央に2つの値があるため、その平均を中央値とする。
  • 最頻値(モード)
    最も頻繁に現れる変量のこと。

上の例で、確認しておきましょう。

最大値は84、最小値は52、平均値は、$$\frac{52+63+63+67+70+77+77+77+84+84}{10} = 71.4$$となります。中央値は上の例では70と77の平均なので、73.5です。最頻値は77ですね。

コメント

タイトルとURLをコピーしました