期待値が同じでも

期待値が同じ確率分布表を比較してみよう。

変数5000000
確率1/51/51/51/51/51
1000000100
変数250250000
確率1/51/51/51/51/51
5050000100
変数100100100100100
確率1/51/51/51/51/51
2020202020100

1 人が 500 円得る場合と、5 人が 100 円ずつ得る場合では、 賞金の分配方法が違う。この分配方法の違いを数字で知ることが分散である。

分散

分散は、それぞれの変数から期待値を引いて、2 乗し、その和を求めたものである。

ワークシートで実際に例を計算してみよう。

ワークシートから、分散の値がそれぞれ異なっていることが分かる。 分散が小さい値の方がデータのばらつきが少ない。

分散と標準偏差

確率分布を表すときに、確率変数の個数 n、 確率 p あるいは、 期待値 μと、分散 V の正の根を取ったもの「標準偏差」 σ とを記して表すことがある。

V = σ 2

データが n 個あり、それぞれの値が xi (i=1, ..., n)のときの 分散 V=σ2 と平均値 m の関係は、以下のように求めた (ワークシートを思い出そう。)。

V = σ2 = ∑i=1n(xi-m)/n

平均 m を、確率変数 X を使って表したととき、 m=E(X) と書くこともある。 ここで、xi2 の平均を考えると、これは E(x2) と書いてよい。これを使うと、分散 V は、

V=E(X2)-E(X)2=E(X2) - m2

と書ける。

実際に E(X2) を計算する方法で、 V を求める方法を実行し、本当に同じになるか確かめてみよう。

和と積分

n がとても大きな数であり、∑ の取る範囲がとても大きい場合、 ∑ は ∫ ... dx に置き換えることができる。