ある事象を観察するとき,何種類かの事象が観測されるときの 割合が一定であるような分布であるかを検定するときに用いるのが カイ2乗(χ2)検定である。観察される事象はお互いに排他的, つまり同時に2つ以上の事象が起こらないようなものでなければならない。 男女比や,サイコロの目,選択肢から1つを選ぶアンケートなどが該当する。
複数の集団があり,何かの兆候が観察される割合が互いに等しいと 言えるかどうかの検定に用いられる。
看々ラーメンと公益軒のラーメンの売り上げ比較。
しょうゆラーメン | もつ煮ラーメン | 合計 | |
---|---|---|---|
看々ラーメン | 333 | 117 | 450 |
公益軒 | 165 | 85 | 250 |
2つの店舗間で,「しょうゆらーめん」vs.「もつ煮ラーメン」の 人気に差があると言ってよいか。
まず行列(matrix)にする。
ramen <- matrix(c(333,165,117,85),2,2) ramen [,1] [,2] [1,] 333 117 [2,] 165 85
表計算上にある観測度数の4つの値(2x2セル)部分をコピーし,
read.table("clipboard")
でtableとして読み込んでもよい。
χ2値を求め,同時に検定を行なうには
chisq.test
関数を用いる(chi-square test)。
引数に検定対象の行列と correct=F
を指定する。
chisq.test(ramen, correct=F)
Pearson's Chi-squared test
data: ramen
X-squared = 5.0101, df = 1, p-value = 0.0252
2x2の度数分布ゆえ,自由度が (2-1)×(2-1) = 1 であることを前提にし,その場合のp値も0.03(3%)と出している。
なお,自由度 n, の下側確率pのときの χ2 値は
qchisq(p, 1)
で得られる。たとえば自由度,下側確率95%(上側5%)と 下側確率99%(上側1%)の χ2値は以下のようにして得られる。
qchisq(0.95, 1) [1] 3.841459 qchisq(0.99, 1) [1] 6.634897
花粉症の症状を緩和するある薬(A)を開発した。薬の効果を試すため, A薬とニセ薬(プラセボ)を同じ種類の花粉症に悩む何人かの被検者に 一定期間服用してもらい,その効果を「改善した」,「改善せず」で 評価してもらった。
改善した | 改善せず | 合計 | |
---|---|---|---|
A薬 | 15 | 8 | 23 |
プラセボ | 8 | 12 | 20 |
合計 | 23 | 20 | 43 |
A薬に症状改善効果があると言ってよいか? 検定せよ。
グラフの描き方を簡潔に示す。
plot()
関数を利用するとグラフやプロット図が得られる。
数学関数のxyグラフを得たい場合は
plot(x軸値の集合, 関数 [, 他のパラメータ])
の形式で呼び出す。x軸値の集合 は
seq()
で生成したものを利用するとよい。
いくつか例を示す。
# y=x2 を -3≦x≦3 の範囲で描画 x <- seq(-3, 3, 0.2) x [1] -3.0 -2.8 -2.6 -2.4 -2.2 -2.0 -1.8 -1.6 -1.4 -1.2 -1.0 -0.8 -0.6 -0.4 -0.2 [16] 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 [31] 3.0 # y=x^2 のグラフをプロット(xが0.2刻み) plot(x, x^2) # [画像] # 同上,点を線(line)で繋ぐ plot(x, x^2, type="l") # [画像] # 同上,xy比を 1.0 に plot(x, x^2, type="l", asp=1.0) # [画像]
χ2の確率密度関数(0≦x≦8)を描いてみる。 自由度3のχ2分布の確率密度関数は dchisq(x, 3) で,これを描くには以下のようにする。
x <- seq(0, 8, 0.01) # オレンジ色で,線の太さ5 plot(x, dchisq(x, 3), type="l", col='orange', lwd=5) # [ 画像 ]
住みやすさの調査をいくつかの都市で行なった。そのうちの A市,B市の住みやすさの回答結果は以下のとおりであった。
住みやすい | ふつう | 住みにくい | 合計 | |
---|---|---|---|---|
A市 | 3820 | 660 | 520 | 5000 |
B市 | 2988 | 500 | 512 | 4000 |
A市とB市の住みやすさ意識に有意な差はあるか。 以下の手順で検定せよ。
chisq.test()
関数で検定せよ
ある飲食店で出した芋サラダを食べた人が具合悪さを訴えた。 調査したところ,同じ日にその品を食べた人に同様の症状が見られたが, 食べない人の中にも症状が見られた。摂取の有無と症状の有無は 以下のようになった。
該当品を食べた | 食べなかった | 計 | |
---|---|---|---|
症状確認あり | 15 | 5 | 20 |
症状確認できず | 25 | 25 | 50 |
計 | 40 | 30 | 70 |
該当品は食中毒症状と無関係と言えるか。
chisq.test()
関数で検定せよ
上記の問題をRを用いて解け。
A4用紙2枚以内に, 氏名,学籍番号を入れ,その後の本体を以下のようにする。
解答の検定部分は,Rに対する入力と出力を記述する。 長い出力は適宜中略してよい。
yuuji@e.koeki-u.ac.jp