大数の法則とは、試行回数が多くなればなるほど、 理論的確率と一致するというものである。
実際にコインや、サイコロで確かめてみよう。
正規分布は、 離散変数確率の分布である二項分布の近似的な式として得られる。 Gauss 分布とも呼ばれる。真値に対する誤差のばらつきに関する分布である。
正確には中心極限定理 (次週) を用いる。 大きな標本数 N に対して二項分布を近似することにより得られる。
正規分布 Normal Distribution とは、 自然解における多くの現象が従うとされる確率分布のことである。
確率変数 x が連続的な場合に
のとき、その分布を正規分布であると定義し、 N(&mu,&sigma2) と表す。 第 2 引数は分散を表す。とくに、標準正規分布とは N(0,1) に従う。 この標準正規分布に自然解における多くの統計的現象が従う。
連続的なとき、関数の形で書くことができる。 確率密度関数 f(x) と呼ぶ。 中央がふくらんでいる形になっている。
f(x) = 1/(√(2 π)σ)e-(x-μ)2/(2 σ2)
二項分布では、 μ = np, σ = √(npq) だったから、
P(|X-np| < k √(npq) ) ≥ 1 - 1/k2
n 回の試行について、出る値の相対度数 X/n (度数分布表の目盛)と、 出る確率との差を調べる式に変更することができて、 回数が多ければ多いほど、実験の値は理論上の値に近づくということになる。 これを大数の法則という。
limn → ∞ P(|X/n - p|< 小さな数) = 1 - 小さな数/n < 1
よって、大きな回数試行を行うと、相対度数 X/n は確率に等しくなる。
中心極限定理とは、大きな数の試行になればなるほど、 N(μ, σ2) の正規分布に近づくという定理のことである。
平均 μ で、 標準偏差 σ のある分布に従うならば、 大きさ n の無作為標本に基づく標本平均は、 n が無限に大きくなるとき、平均 μ で 標準偏差 σ の正規分布 N(μ,σ2)に近づく。
とくに、 Stirling の公式と中心極限定理を用いて、二項定理 B(n, p) が正規分布 N(0,1)に近似される。ただし、n 回の試行、確率が p, 期待値 μ, 標準偏差 σ とする。
nCk pkqn-k ∼ 1/√(2 π p q) exp(-(k-np)2/(2 n p q))
平均 μ と分散 σ2 で決まる正規分布 N(μ,σ2) では、データのばらつきが次のように表される。
ある値 x がどれだけその統計において優れている(劣っている)かどうかを示 す指標。平均を μ, 標準偏差を σ とする。標準測度 t は
t = (x-μ) / σ
と書ける。
n が十分大きく、 x が B(n,p) に従うとき、平均値 μ, 標準偏差 σ として、Z=(x-μ)/σ と取りなおした確率変数 Z は、標準正規分布 N(0, 1) に従うとみなすことができる。
標準正規分布 N (0, 1) の 確率積分表。
台形公式を使って数値計算したもの。