統計の考え方 第 8 回 (確率変数) 「統計の用語 」 講義ノート目次

統計の用語についてまとめる。

母集団 (population)
調査したデータの集団のこと。
全体調査
データの全てを取った場合
標本 (sample)
標本調査
一部を取り出し、標本でデータの特性値を調べる方法。

データの分布特性を表す概念

標本分布の特性値についてまとめる。 ある集合の要素を小さい順に書き、これを A = {0, 0, 1, 2, 3, 6} とする。

平均値 (average)
全ての値の和をデータの個数で割ったもの: (0 + 0 + 1 + 2 + 3 + 6)/6 = 2
中央値 (median)
データを一列にならべたときのちょうど真ん中の値: (1 + 2) / 2 = 1.5
最頻値 (mode)
最も頻繁に表れた値: 0
分散
各データの平均値からのずれの 2 乗和をデータ数で割ったもの:
(0 - 2) 2 + (0 - 2) 2 + (1 - 2) 2 (2 - 2) 2 + (3 - 2) 2 + (6 - 2) 2
= 4 + 4 + 1 + 0 + 1 + 4 = 14,
標準偏差
データの平均値からの各標本のばらつき具合, 標準偏差は分散の平方根: