単純平均値

すなわち次の式で表わすこともできます。

」は「エックスバー」と読み、データの平均値を意味します。

平均値は必ずしも多勢を表わす指標ではないことに注意が必要です。

なお他にも平均値と呼ぶ指標があり、それ特別するため、単純平均値(たんじゅんへいきんち)、相加平均値(そうかへいきんち)と表わすことがあります。


ExcelではAVERAGE関数で求めることができます。

範囲指定した中に空白や文字列のセルが含まれると、データ個数にはカウントされず、無視されます。
この場合は合計がが15、空白セルや文字列を含む5つのセルを範囲選択したら、データ個数は4とカウントされ、単純平均値は 11 ÷ 4 = 2.75と出力されます。

Rの場合、平均値(mean)はdata_aが3、data_bが2.75と表示されています。
文字列を含む列(ここではdata_c)では、文字列のデータとして認識されています。

S-PLUSではdata_cは文字列(Data Typeを「character」とする)にしないと「aa」と入力・認識できません。
その上で、data_aは平均値が3、data_bは平均値が2.75と表示されました。


度数分布表からおおよその平均値を求める

度数分布表を基に場合は、「階級値」と「度数」から、おおよその平均値を求める方法があります。

階級(身長の場合)階級値度数
130cm以上140cm未満135cm2
140cm以上 150cm未満145cm6
150cm以上 160cm未満155cm8
160cm以上 170cm未満165cm4
170cm以上 180cm未満175cm2

130cm以上 140cm未満の階級に2人が含まれる場合……

  1. 階級値(かいきゅうち)を135cmとします。
  2. 130cm以上 140cm未満の階級が2人なので、135 × 2を計算します。
  3. この要領で140cm以上 150cm未満の階級についても計算をします(145 × 6)。
  4. 150cm以上160cm未満の階級(155 × 8)、160~170cm(165 × 4)、170~180cm(175 × 2)と計算をし、すべて合計します(135 × 2 + 145 × 6 + 155 × 8 + 165 × 4 + 175 × 2 = 3,390)
  5. 全体の度数(つまり全体の人数)で割り算したものを、度数分布表から平均値とします
    (3,390 ÷ 22 ≒ 154.09)。

Σ記号(シグマ記号)