大数の法則

大数の法則とは、試行回数が多くなればなるほど、理論的確率と一致するというものである。

実際にコインや、サイコロで確かめてみよう。

正規分布 N(μ, σ²)

正規分布は、離散変数確率の分布である二項分布の近似的な式として得られる。 Gauss 分布とも呼ばれる。真値に対する誤差のばらつきに関する分布である。

正確には中心極限定理 (次週) を用いる。大きな標本数 N に対して二項分布を近似することにより得られる。

正規分布 Normal Distribution とは、自然解における多くの現象が従うとされる確率分布のことである。

確率変数 x が連続的な場合に

のとき、その分布を正規分布であると定義し、 N(&mu,&sigma²) と表す。第 2 引数は分散を表す。とくに、標準正規分布とは N(0,1) に従う。この標準正規分布に自然解における多くの統計的現象が従う。

連続的なとき、関数の形で書くことができる。確率密度関数 f(x) と呼ぶ。中央がふくらんでいる形になっている。

f(x) = 1/(√(2 π)σ)e^{-(x-μ)²/(2 σ²)}

二項分布では、 μ = np, σ = √(npq) だったから、

P(|X-np| < k √(npq) ) ≥ 1 - 1/k²

n 回の試行について、出る値の相対度数 X/n (度数分布表の目盛)と、出る確率との差を調べる式に変更することができて、回数が多ければ多いほど、実験の値は理論上の値に近づくということになる。これを大数の法則という。

lim_{n → ∞} P(|X/n - p|< 小さな数) = 1 - 小さな数/n < 1

よって、大きな回数試行を行うと、相対度数 X/n は確率に等しくなる。

中心極限定理とは、大きな数の試行になればなるほど、 N(μ, σ²) の正規分布に近づくという定理のことである。

平均 μ で、標準偏差 σ のある分布に従うならば、大きさ n の無作為標本に基づく標本平均は、 n が無限に大きくなるとき、平均 μ で標準偏差 σ の正規分布 N(μ,σ²)に近づく。

とくに、 Stirling の公式と中心極限定理を用いて、二項定理 B(n, p) が正規分布 N(0,1)に近似される。ただし、n 回の試行、確率が p, 期待値 μ, 標準偏差 σ とする。

_nC_k p^kq^n-k ∼ 1/√(2 π p q) exp(-(k-np)²/(2 n p q))

平均 μ と分散 σ² で決まる正規分布 N(μ,σ²) では、データのばらつきが次のように表される。

ある値 x がどれだけその統計において優れている(劣っている)かどうかを示す指標。平均を μ, 標準偏差を σ とする。標準測度 t は

t = (x-μ) / σ

と書ける。

n が十分大きく、 x が B(n,p) に従うとき、平均値 μ, 標準偏差 σ として、Z=(x-μ)/σ と取りなおした確率変数 Z は、標準正規分布 N(0, 1) に従うとみなすことができる。

標準正規分布 N (0, 1) の確率積分表。

台形公式を使って数値計算したもの。