大数の法則

大数の法則とは、試行回数が多くなればなるほど、 理論的確率と一致するというものである。

実際にコインや、サイコロで確かめてみよう。

正規分布 N(μ, σ2)

正規分布は、 離散変数確率の分布である二項分布の近似的な式として得られる。 Gauss 分布とも呼ばれる。真値に対する誤差のばらつきに関する分布である。

正確には中心極限定理 (次週) を用いる。 大きな標本数 N に対して二項分布を近似することにより得られる。

二項分布から正規分布を導くには

正規分布 Normal Distribution とは、 自然解における多くの現象が従うとされる確率分布のことである。

確率変数 x が連続的な場合に

のとき、その分布を正規分布であると定義し、 N(&mu,&sigma2) と表す。 第 2 引数は分散を表す。とくに、標準正規分布とは N(0,1) に従う。 この標準正規分布に自然解における多くの統計的現象が従う。

連続的なとき、関数の形で書くことができる。 確率密度関数 f(x) と呼ぶ。 中央がふくらんでいる形になっている。

f(x) = 1/(√(2 π)σ)e-(x-μ)2/(2 σ2)

Chebyshev の不等式と二項分布

二項分布では、 μ = np, σ = √(npq) だったから、

P(|X-np| < k √(npq) ) ≥ 1 - 1/k2

n 回の試行について、出る値の相対度数 X/n (度数分布表の目盛)と、 出る確率との差を調べる式に変更することができて、 回数が多ければ多いほど、実験の値は理論上の値に近づくということになる。 これを大数の法則という。

limn → ∞ P(|X/n - p|< 小さな数) = 1 - 小さな数/n < 1

よって、大きな回数試行を行うと、相対度数 X/n は確率に等しくなる。

中心極限定理

中心極限定理とは、大きな数の試行になればなるほど、 N(μ, σ2) の正規分布に近づくという定理のことである。

平均 μ で、 標準偏差 σ のある分布に従うならば、 大きさ n の無作為標本に基づく標本平均は、 n が無限に大きくなるとき、平均 μ で 標準偏差 σ の正規分布 N(μ,σ2)に近づく。

とくに、 Stirling の公式と中心極限定理を用いて、二項定理 B(n, p) が正規分布 N(0,1)に近似される。ただし、n 回の試行、確率が p, 期待値 μ, 標準偏差 σ とする。

nCk pkqn-k ∼ 1/√(2 π p q) exp(-(k-np)2/(2 n p q))

正規分布のばらつきについて

平均 μ と分散 σ2 で決まる正規分布 N(μ,σ2) では、データのばらつきが次のように表される。

標準測度

ある値 x がどれだけその統計において優れている(劣っている)かどうかを示 す指標。平均を μ, 標準偏差を σ とする。標準測度 t は

t = (x-μ) / σ

と書ける。

二項分布の正規近似

n が十分大きく、 x が B(n,p) に従うとき、平均値 μ, 標準偏差 σ として、Z=(x-μ)/σ と取りなおした確率変数 Z は、標準正規分布 N(0, 1) に従うとみなすことができる。

標準正規分布の確率積分表

標準正規分布 N (0, 1) の 確率積分表

台形公式を使って数値計算したもの。