相関系数と回帰分析

相関系数

相関系数とは二項目のデータの関連性を示す指標である。

参考Web

なるほど統計学園「複数の変数の関係性を見る」

相関関係の強さは

相関系数の絶対値強さ
0.0〜0.2相関関係ほぼなし
0.2〜0.4やや相関関係あり
0.4〜0.7相関関係あり
0.7〜1.0強い相関関係あり
となっている。

いつものようにファイルをダウンロードして使用する。
data10.ods
(学籍番号を追加しておくこと)

まずは練習用のシートを使い相関係数を求めてみる。

相関系数を算出する関数は =CORREL(データ範囲,データ範囲) (correlationの略)

相関係数の値から、身長と体重には強い相関関係があり、身長と点数には相関関係はほぼないことがわかる。

回帰分析

大雑把に言ってしまうと 体重と身長といったデータを(一次)方程式の形で表現し、それを元にして分析を 行なったりすること。
強い相関関係にあるデータを分析するのに向いている。

散布図を元に回帰式を作ることができる。

身長と体重のデータを範囲選択して散布図を作成する。

ウィザードで設定が終わったら、 データの上で右クリックし「近似曲線を挿入」をクリック
kinji01
線の種類は「直線」、太さなどを調節する。

近似曲線ができたらクリックして選択し、 「右クリック」→「R2値と近似曲線の方程式を挿入」
r2

近似曲線の一次方程式と決定係数(R2)が表示される。
r2-2

強い相関関係にある身長と体重の場合、 身長がわかれば体重が予測しやすい。
一方相関関係がほぼない身長と点数の場合グラフから予測などの読み取りが困難のため回帰分析には向いていない。

決定係数(R2)とは

回帰式の信頼度を表す数値。0〜1の値を指す。1に近いほど信頼度が高い。
(相関係数を二乗した値と同じものになる)

参考
なるほど統計学園「複数の変数の関係性を見る」(″回帰式の当て はまり″の項目)

本日の課題


トップ