期待値が同じ確率分布表を比較してみよう。
変数 | 500 | 0 | 0 | 0 | 0 | 計 |
確率 | 1/5 | 1/5 | 1/5 | 1/5 | 1/5 | 1 |
積 | 100 | 0 | 0 | 0 | 0 | 100 |
変数 | 250 | 250 | 0 | 0 | 0 | 計 |
確率 | 1/5 | 1/5 | 1/5 | 1/5 | 1/5 | 1 |
積 | 50 | 50 | 0 | 0 | 0 | 100 |
変数 | 100 | 100 | 100 | 100 | 100 | 計 |
確率 | 1/5 | 1/5 | 1/5 | 1/5 | 1/5 | 1 |
積 | 20 | 20 | 20 | 20 | 20 | 100 |
1 人が 500 円得る場合と、5 人が 100 円ずつ得る場合では、 賞金の分配方法が違う。この分配方法の違いを数字で知ることが分散である。
分散は、それぞれの変数から期待値を引いて、2 乗し、その和を求めたものである。
ワークシートで実際に例を計算してみよう。
ワークシートから、分散の値がそれぞれ異なっていることが分かる。 分散が小さい値の方がデータのばらつきが少ない。
確率分布を表すときに、確率変数の個数 n、 確率 p あるいは、 期待値 μと、分散 V の正の根を取ったもの「標準偏差」 σ とを記して表すことがある。
V = σ 2
データが n 個あり、それぞれの値が xi (i=1, ..., n)のときの 分散 V=σ2 と平均値 m の関係は、以下のように求めた (ワークシートを思い出そう。)。
V = σ2 = ∑i=1n(xi-m)/n
平均 m を、確率変数 X を使って表したととき、 m=E(X) と書くこともある。 ここで、xi2 の平均を考えると、これは E(x2) と書いてよい。これを使うと、分散 V は、
V=E(X2)-E(X)2=E(X2) - m2
と書ける。
実際に E(X2) を計算する方法で、 V を求める方法を実行し、本当に同じになるか確かめてみよう。
n がとても大きな数であり、∑ の取る範囲がとても大きい場合、 ∑ は ∫ ... dx に置き換えることができる。