roy > naoya > 実用情報 > (11)表計算ソフト[6] データ処理の効率化
(11) 表計算ソフト[6] データ処理の効率化
[2]本日の内容
前回は、各質問に対する学年別のデータ処理結果をグラフ化し、学年による回答の差異を吟味できるようにした。今回は、別の視点からデータ処理を行うことにする。
今回のテーマは、自信群と不安群の特徴を探ることである。3の質問項目はコンピュータに対する不安意識を探ったものであり、不安は次の3つの因子で説明できることがわかっている。
- オペレーション不安:コンピュータ操作に対する不安(値が大きいほど不安が高い)
- テクノロジー不安:新しいテクノロジに対する忌避的な態度(値が大きいほど避ける気持ちが強い)
- 肯定的評価:コンピュータに対する肯定的な意識(値が高いほど否定的)
今回は、これらの得点が高い人(不安群)と低い人(自信群)の他の質問に対する回答を比較し、セキュリティに対する知識やコンピュータに対する習熟度、利用状況から不安や自信を説明することが出来ないかを検討する。
あわせて、2020年度の1年生の回答を比較することで、今年の1年生が不安群と自信群のどちらに近いのかを調べていこう。
[3]事前作業
raw_data.xls(前回まで使用しているファイル)を使用する。その上で次の作業を行う。
- 自信群と不安群の分析を行うため、「分析用」ワークシートの複製を作成し、「自信不安」というような名称をつける
- 「分析用」ワークシートも「学年別」というような名称に変えておく
- 「自信不安」のワークシートでは、すでに学年別の集計が行われているので、グラフは削除(DELキーで削除可能)し、ワークシート下部の表の内容も消去する(すべて残しておいて、関数を使って計算を行う際の範囲選択をやり直すという方法もある。どちらでもよい)
- 因子1、因子2、因子3の各人の得点の合計を求め、合計得点に応じて並び替え(昇順)を行う
- 合計得点の低い50名を「自信群」、合計得点の高い50名を「不安群」とし、残りのデータは削除する(合計得点が同一の者がいる場合は、50人ぴったりで切らずに、同一得点の者は全て各群に含めるものとする)
[4]自信群と不安群の回答の傾向
データの準備が出来たら、学年別のデータ処理を同じ処理を行ってみよう。最低でも上の4項目は完成させる。
まず、最低限実施すべき4項目について示す。
- 2の「基礎知識」~「表計算」の6項目の群別平均習熟得点と平均習熟率
- 3の各因子の群別平均得点
- 4-1の各セキュリティリスクの群別認知率
- 4-2の各セキュリティリスクへの対策の理解度の群別平均点
次に、時間があれば実施して欲しい項目を示す。
- 上の4項目について、群別のみでなく1年生(2020年度)の得点を算出する(前回のワークシートからコピーすればよい)
- 2の個別の質問項目に対する群別平均習熟率
- 1-9の主に使用する機能における、各機能の群別使用率
- その他1の各項目
[5]データ処理結果の解釈
これまで学年別、自信別に各質問項目について平均値や比率を計算し、グラフを作成してきた。学年別のデータ処理結果についてはグラフから読み取れる差異を記述し、こうした結果がもたらされた理由を考察してきた。本日は自信群と不安群のデータ処理結果について、差が見られる点を確認した上で、差が生じた理由について考察する。さらに1年生(2020年度)のデータを自信群、不安群と比較し、今年の1年生の特徴について検討してみる。
考察の方針
- 自信群と不安群は習熟率やセキュリティの認知度、理解度においてどのような違いが見られるのかをグラフから読み取り、これらの差異が見られる理由について考察する。各グラフの近くに読み取った結果と考察を記載する
- 今年の1年生の結果を自信群、不安群と比較し、どちらに傾向が似ているのかを調べる。その上で、今年の1年生の特徴を述べる(グラフの近くに記載しておく)。
今回はグラフから傾向を読み取るが、このような手続きは厳密には正しくない。グラフ上では差があるように見えたとしても実際には差が無い可能性もあるからである。仮にサイコロを10回振った時の平均値を求めた場合、最初の10回と2回目の10回では平均値が異なる可能性が高い。このように測定をしたデータには一定の誤差が含まれる。誤差があることを考慮した上で、実際に差があるのか無いのかを検討する必要がある。誤差を踏まえた上で複数の平均値間に意味のある差(有意差)があるのかどうかを調べる手法にt検定や分散分析がある。また、回答の比率に差があるかどうかを比較するχ2検定という手法もある。
これらの検定手法については、この授業では取り扱わない。関心がある者は統計学を履修するとよい。