統計の考え方 第 12 回 (確率分布 / 連続的な確率分布) 「(発展)二項分布の詳しい説明 」 講義ノート目次

ある事柄において、 必ず 2 つの結果しか起こらない場合、それは二項分布に従う。 発見した数学者の名前から Bernoulli [べるぬーい] 分布とも呼ばれる。

例えば、コイントスを 1 回行ったとき、 表または裏が出る確率 p, q はそれぞれ 1/2 である。

表または裏なので、かならず p + q = 1

コイントスを n 回行ったとき (この段落では簡単のため n を偶数と仮定して話をすすめる) 、 表 (裏) が出続ける回数がどのように分布するか、考えよう。 一番多く出現するであろうパターンは、 n / 2 回ずつ表と裏が計測される場合である。 しかしながら、実際行ってみると、全て表 (裏) が出ることもある。 今、表が出つづける確率を考える。表の出る回数を np とする。 (確率 P(np,nq) において、np + nq = n である)

一般には、

P(np = n, n_1 = 0) = pnp = 1/2 × 1/2 × ... × 1/2 = p np

全体で n 回のトスを通じて、 ある 1 回を除いて表が出た (1 回だけ裏が出た) 場合は、

一般には、

P(n-1,1) = n C1 × pn-1 × q

ただし今の場合

p = 1/2, q = 1/2

である。全体で n 回のトスを通じて k 回裏が出た場合は結局次のようになる。

P(n-k,k) = n Ck pn-k × qk (p = 1/2, q = 1/2)

n 回のトスを通じて、 表裏の出る組み合わせを全て考えると、

1 = ∑k=1n n Ck pn-k × qk (p = 1/2, q = 1/2)

となる。

二項分布の特徴

標本数 n で、ある確率が p (起こらない確率は q = 1 - p ) の二項分布は B(n,p) と表す。

平均 μ = np
分散 σ2 = npq