(4) 10/19の授業内容:t検定

[1] 導入

あなたは公益軒の経営者である。公益軒では最近カレーラーメンをメニューに加え、好評な売り上げを得るにいたっている。しかし、カレーラーメンを注文する人は年配の人が多く、若者への評判はいまいちな気がする。一方、ライバルのカンカンラーメンは若者もカレーラーメンを注文しているようである。カンカンのカレーラーメンが若者に人気があるとすれば、若者は情報網を持っているため、人気が一気に拡大する可能性がある。

果たして若者は、公益軒とカンカンのカレーラーメンの味をそれぞれどの程度好んでいるのであろうか。両者の評価が異なるのかを調べるため、駅の改札を通る若者を10人ごとに1人選び出して調査を依頼した。1人目は公益軒、2人目はカンカン、3人目は公益軒というようにして、順番に割り当てていき100点満点で味を採点してもらった。このようにしてそれぞれの店のカレーラーメンについて8人ずつのデータを取った。

公益軒	点数	カンカン	点数
1	70	1	85
2	75	2	80
3	70	3	95
4	85	4	70
5	90	5	80
6	70	6	75
7	80	7	80
8	75	8	90
平均	76.88	平均	81.88
分散	46.61	分散	55.86

平均値の差を見ると5点近くある。やはり公益軒のカレーラーメンは若者に対してうけがよくないのであろうか。

[2] 母平均の信頼区間を踏まえて差を検討する

>>More

[3] 差の信頼性区間の考え方

>>More

>>Close

母集団の平均値が範囲で示されるのだから、母集団の平均値の差も範囲で示されることになる。つまり、差についても信頼区間の考え方が適用される。ここで、母集団Aと母集団Bを考える。それぞれの母集団から同じ人数の標本a、標本bを抽出する。そしてそれぞれの標本について平均と分散を計算する（分散＝標準偏差の2乗）。

標本の抽出と平均と分散の計算を何度も繰り返し実施した場合、標本aと標本bの平均の差の分布はどうなるだろうか？標本aと標本bの平均値の分布がt分布に従うことから、平均値の差の分布もt分布に従い、信頼区間を求める式をそのまま利用することができる。

つまり、

平均の差の信頼区間＝（標本aの平均－標本bの平均）±t×差の標本標準誤差

となる。

ここで問題となるのは「差の標本標準誤差」をどのようにして求めるかということである。母集団Aにおける標本平均の分散は

母集団Aの分散／標本aの大きさ

で求められる。

同様にして、母集団Bにおける標本平均の分散も求めることができる。では、これら差である（標本aの平均－標本bの平均）の分散はどうなるのであろうか。

これは、

（母集団Aの分散／標本aの大きさ）＋（母集団Bの分散／標本bの大きさ）

になる。単に足し算をすればよいというのは違和感を感じるが、実際にそうなることを確認してみよう。

確認

Y{1, 2, 3, 4, 5},Z{4, 1, 3, 5, 2}とする。YとZの分散を求めて和を出した結果と、Y-Zを計算した後（つまり{-3, 1, 0, -1, 3}を求めた上）で分散を求めた結果を比較してみよう（YとZをそれぞれ標本を5回取り出した時の平均値とする）。

分散は標準偏差の2乗であるため、標準偏差を求める関数を使って計算した結果を2乗すればよい。この場合5つのデータが標本なのか母集団なのか不明なので、STDEVでもSTDEVPでもどちらを使ってもよい。なお、分散を求める関数もあるので、念のために紹介する。

VARP：データを母集団とみなした場合の分散
VARP：データを標本とみなし母集団の分散を推定する場合（分母でデータ数－1をしている）

したがって、差の標本標準誤差は次の式で表現できる。

差の標本標準誤差＝sqrt（（母集団Aの分散／標本数a）＋（母集団Bの分散／標本数b））

ここで、母集団AとBの分散は等しいとして、「推定母分散」と表記すると、

差の標本標準誤差＝sqrt（（推定母分散／標本数a）＋（推定母分散／標本数b））
　　　　　　　　　　　　＝sqrt（推定母分散×（（1／標本数a）＋（1／標標本数b））

となる。

ここでは2つの母集団を比較しているが、2つの母集団には差がなく、標本における平均値の差は、偶然に発生したものと考えるため、母集団AとBの分散は等しいと考えてよい

推定母分散は次の式で推定する。これは標本標準偏差を求める方法と同じで、平均からの偏差平方和を（標本数-1）で割ったものに相当する。

推定母分散＝（標本aの平均からの偏差の平方和＋標本bの平均からの偏差の平方和）／（（標本数a－1）＋（標本数b－1））

これで平均の差の信頼区間が計算できる。

なお、Σ（データ－平均値）²を偏差平方和という。偏差平方和をデータ数で割れば母分散、（データ数－1）で割れば標本分散、データ数で割り平方根をとれば母標準偏差、（データ数－1）で割り平方根をとれば標本標準偏差となる。

[4] 実際に差の信頼区間を求めてみる

>>More

[5] 差の信頼性区間の解釈

>>More

[6] 指標tの性質

さて、公益軒とカンカンのカレーラーメンの味の評価に有意な差があるかどうかを決める方法を考えていこう。このためには前回説明した仮説検定の考え方を用いる。

まず、「公益軒とカンカンのカレーラーメンの味の評価には差がない」という帰無仮説を立てる。
差がないという仮説を立てた場合、今回の測定値の平均値の差は偶然に発生したことになるので、この差が偶然に発生する確率を求める。
確率に基づいて、帰無仮説を採択するか、棄却するかを決める。
帰無仮説を採択した場合は、有意差（意味のある差）はないと結論を下す。
帰無仮説を棄却した場合は、対立仮説が採択され、差がないとは言えない、つまり有意差（意味のある差）があると結論づける。

前回、名義尺度の分析を行う際には、期待度数と観測度数のずれをχ2乗値という指標で表現した。今回は距離尺度の平均値の比較である。距離尺度や比率尺度において2つの母集団の平均値に差があるかどうかを検討する場合t検定が用いられる。

まず2つの母集団A、Bを考える。AもBも大体正規分布にしたがっており、平均値が等しく、分散もほぼ等しいとする。その2つの母集団A、Bそれぞれからa個、b個の標本を取り出してくる。それを標本集団a、bとする。

標本集団a、bの平均値をそれぞれ計算して、それを標本平均a、bとする。

標本平均aと標本平均bの差を計算する。すると、これは0に近い場合が多いと考えられる。なぜなら、もともとの母集団A、Bの平均値が等しいからである。そこから取り出した標本集団a、bの平均値も近い値になることが多いことが推測される。

そこで、次のような指標tを考える。

t＝（標本平均の差）／（標本平均の差の標準誤差）

すると、このtは自由度（a＋b-2）のt分布に従う。標本平均の差の標準誤差は、上で説明したように、次の式で推定する。

標本平均の差の標準誤差＝sqrt（（母集団Aの分散／aの標本数）＋（母集団Bの分散／bの標本数））

ここで、aとbの母分散は等しいとして、「推定母分散」と表記すると、

差の標本標準誤差＝sqrt（（推定母分散／標本数a）＋（推定母分散／標本数b））
　　　　　　　　　　　　＝sqrt（推定母分散×（（1／標本数a）＋（1／標本数b））

推定母分散は次の式で推定する。これは標本標準偏差を求める方法と同じで、平均からの偏差の平方和（これは分散を求めるときの（（データ－平均値）の2乗）の総和のことです）を（標本数－1）で割ったものに相当する。

推定母分散＝（標本aの平均からの偏差の平方和＋標本bの平均からの偏差の平方和）／（（標本数a－1）＋（標本数b－1））

まとめると、

t＝（標本平均の差）／sqrt（推定母分散×（（1／標本数a）＋（1／標本数b））

となる。

[7] 指標tを計算してみよう

それでは実際に、公益軒とカンカンのカレーラーメンの評価点について、tを計算してみよう。

まず、標本平均の差は、

標本平均の差＝76.88-81.88

　　　　　　＝-5.00

次に、差の標準誤差を求める。

公益軒の評価点の標本分散＝49.61

　その平均からの偏差の平方和＝49.61×8

カンカンの評価点の標本分散＝55.86

　その平均からの偏差の平方和＝55.86×8

推定母分散＝（49.61×8＋55.86×8）／（（8-1）＋（8-1））

　　　　　＝60.27

差の標本標準誤差＝sqrt（60.27×（（1/8）＋（1/8）））

　　　　　　　　＝3.88

そうすると、tはこうなる。

t＝-5.00／3.88

　＝-1.29

練習：表計算ソフトを用いて公益軒とカンカンの例についてt値を求めてみよう

[8] t分布表を見る

さて、t=-1.29となった。この値はどのくらいの確率で起こるのだろうか。

それを調べるためには、t分布表を使用する。

t分布は自由度によって少しずつ変化する。t検定の場合は、（標本数a-1）と（標本数b-1）を足したものが自由度になる。この場合、標本数aも、標本数bも8だったので、(8-1)+(8-1)で、自由度は14になる。

それでは、t分布表の自由度14のところを見てみよう。

自由度	有意水準5%	有意水準1%
1	12.706	63.657
2	4.303	9.925
3	3.182	5.841
4	2.776	4.604
5	2.571	4.032
6	2.447	3.707
7	2.365	3.499
8	2.306	3.355
9	2.262	3.250
10	2.226	3.169
11	2.201	3.106
12	2.179	3.055
13	2.160	3.021
14	2.145	2.977
15	2.131	2.947
16	2.120	2.921
17	2.110	2.898
18	2.101	2.878
19	2.093	2.861
20	2.086	2.845
21	2.080	2.831
22	2.074	2.819
23	2.069	2.807
24	2.064	2.797
25	2.060	2.787
26	2.056	2.779
27	2.052	2.771
28	2.048	2.763
29	2.045	2.756
30	2.042	2.750
40	2.021	2.704
60	2.000	2.660
120	1.980	2.617
∞	1.960	2.576

自由度14において、有意水準5%のtは2.145、有意水準1%のtは2.977と書いてある。これは次のことを意味している。

自由度14のときのt分布を描いてみると、tが2.977よりも大きい、または-2.977よりも小さいことが起こる確率が1%未満であるということを示している。
また、tが2.145よりも大きい、または-2.145よりも小さいことが起こる確率が5%未満であるということを示している。

tが2.977よりも大きい、または-2.977よりも小さい部分を、1%有意水準での棄却域と呼ぶ。

同様に、tが2.145よりも大きい、または-2.145よりも小さい部分を、5%有意水準での棄却域と呼ぶ。

[9] t検定の考え方

いま、有意水準を5%に設定したとすると、tが2.145よりも大きいか、-2.145よりも小さければ（棄却域に入っている）、それが起こる確率は5%未満なので、2つの母集団の平均、つまり公益軒とカンカンの評価点の平均には差がないとした帰無仮説が棄却される。この結果、公益軒とカンカンの評価点の平均には差がないとはいえない、つまり、差があるということになる。

さて、計算したtは、-1.29だったので、5%有意水準での棄却域には入っていない。したがって帰無仮説は棄却できず、結論としては、公益軒とカンカンの評価点の平均には差がないということになる。

[10] t検定の種類

今回の事例では公益軒のラーメンを食べた人と、カンカンラーメンを食べた人が異なっているが、場合によっては同じ人が両方のラーメンを食べることもありうる。同じ人が両方食べた場合は、どちらか一方のみ食べた場合と比較して、個人差の影響が少なくなることが考えられる。このためt検定を行う際に簡易式を用いることができる。

異なる人がいずれかの条件に割り当てられている場合は対応のないt検定が適用される。一方、同じ人が両方の条件に参加している場合は対応のあるt検定が行われる。

対応がないt検定（データ数が等しくない場合）

Xバー：平均値
n：標本数（データ数）
s²：母分散（VARPまたはSTDEVの2乗）
σ²：標本分散（VARまたはSTDEVの2乗）
自由度：n₁+n₂-2

または

対応がないt検定（データ数が等しい場合）

Xバー：平均値
n：標本数（データ数）
s²：母分散（VARPまたはSTDEVの2乗）
σ²：標本分散（VARまたはSTDEVの2乗）
自由度：n₁+n₂-2

または

対応のあるt検定

Dバー：差の平均値
n：標本数（データ数）
σ：標本標準偏差（STDEV）
自由度：n-1

[11] 練習問題

新製品のチーズラーメンの味の点数について、それぞれ8名ずつ得点をたずねてみた。この点数を使ってt検定をしてみよう（公益軒とカンカンではそれぞれ別の人に採点を求めている）。

公益軒	点数	カンカン	点数
1	80	1	75
2	75	2	65
3	80	3	80
4	95	4	85
5	90	5	75
6	80	6	80
7	85	7	80
8	90	8	70

t検定を実施して結論を導き出すための手順は以下の通りである。順番に実施してみよう。

帰無仮説を立てる
対立仮説を立てる
t値を計算する
自由度を求める
t分布表を調べる
計算したt値と表の値を比較する
結論を述べる

結果の記載方法

レポート等でt検定を実施した結果を記述する場合、記載すべき項目が定められている。以下に例を示すので、今後レポートを作成する際には参考にしよう。

表○は、カンカンラーメンと公益軒のカレーラーメンの味についてそれぞれ8名評価を求めた結果である。t検定の結果、両店の味には有意な差はみとめられなかった（t(14)=-1.29, n.s.）。

なお、t(14)の(14)は自由度をあらわす。

有意：偶然に発生した差ではなく意味の有る差であるという意味

[12] 練習問題2

以下は、8人の若者の協力を得て、公益軒とカンカンの激辛プリンを食べ比べてもらい、双方について得点をつけてもらった結果である。

評価者	公益軒	カンカン
1	90	95
2	75	80
3	75	80
4	75	80
5	80	75
6	65	75
7	75	80
8	80	85

t検定を実施して結論を導き出すための手順は以下の通りである。順番に実施してみよう。

[13] t検定が適用できない場合

t検定は距離尺度および比率尺度において、2条件の有意差の有無を検討するための検定手法である。式は2種類であり、2条件のデータに対応がある場合（同じ人が両方の条件に参加している場合）と対応がない場合（各条件に異なる人が割り当てられている場合）で使い分けを行う。

以下のような場面ではt検定を用いることができないので注意する必要がある。

2条件以上の平均値の差の検定を行う場合：例えばカンカンと公益軒と、来々軒のラーメンの味を比較する場合。
2条件の標準偏差が等しいとみなせない場合：公益軒は評点のバラツキが大きいが、カンカンは全員80点の場合等。

3条件以上の平均値の差の検定を行う場合は分散分析という手法を使用する。また2条件の標準偏差が等しいとみなせない場合はウェルチの法によるt検定を実施する。2条件の標準偏差が等しいとみなせるかどうかは、F検定を実施して判断する。

[14] レポート課題

以下の2問を解きなさい。

(1)夏休みに語学研修を行った。効果を調べるために研修前と研修後にテストを実施した。以下がテストの点数である（20名分）。語学研修は効果があったといえるだろうか。

学籍番号	研修前	研修後
c120001	68	78
c120002	71	72
c120003	86	93
c120004	65	63
c120005	59	64
c120006	62	65
c120007	80	79
c120008	63	68
c120009	65	72
c120010	63	73
c120011	66	67
c120012	58	65
c120013	58	69
c120014	56	62
c120015	64	73
c120016	65	79
c120017	65	63
c120018	65	71
c120019	63	72
c120020	61	61

(2)以下は上級プログラミングで行われた中間テスト（50点満点）のクラス別の受講者の得点である。AクラスとBクラスでは成績に差があるといえるだろうか。

Aクラス	12	26	35	18	43	25	26	37	19	28	36	24	29	23	30
Bクラス	23	35	28	49	37	30	26	45	29	33	41	38	25	34	33	42

2つの問題について、以下の流れで検定を行い結果をまとめなさい。1～8まですべてエクセルファイル内に記載すること。体裁は自由とするがそれぞれの問題に対する回答を1つのワークシートに読みやすくまとめること（合計でワークシートは2つ使用する）。

帰無仮説を立てる
対立仮説を立てる
自由度を求める
t値を計算する
t分布表を調べる
計算したt値と表の値を比較する
結論を述べる

提出要領

To: naoya @ e.koeki-u.ac.jp（@前後のスペースを除去すること）
Subject: 社会情報処理(4)
提出期限：次回授業開始時まで
ファイルを添付して送ること。ファイル名は学籍番号-shakai4.xls

自主課題

ウェルチの法によるt検定と、F検定の方法について調べてみよう。

(4) 10/19の授業内容:t検定

[1] 導入

[2] 母平均の信頼区間を踏まえて差を検討する

信頼性区間の求め方（確認）

[3] 差の信頼性区間の考え方

確認

[4] 実際に差の信頼区間を求めてみる

[5] 差の信頼性区間の解釈

[6] 指標tの性質

[7] 指標tを計算してみよう

[8] t分布表を見る

[9] t検定の考え方

[10] t検定の種類

対応がないt検定（データ数が等しくない場合）

対応がないt検定（データ数が等しい場合）

対応のあるt検定

[11] 練習問題

結果の記載方法

[12] 練習問題2

[13] t検定が適用できない場合

[14] レポート課題

提出要領

自主課題