roy > naoya > 情報リテラシーII > (7)表計算ソフト[2] 入力データの編集(エディティング)
(7) 表計算ソフト[2] 入力データの編集(エディティング)
[11]アンケートデータの入力
質問紙調査のデータをまとめたファイルを配布する。この調査は一昨年度実施しており、250名程度のデータがすでにある。ここに情報リテラシーII履修者のデータが追加されている。これらをあわせて分析することにより、10年前と現在のセキュリティに対する知識や意識の違いを明らかにしてこう。
このデータに自分のデータを追加しよう。なお、入力時のルールは以下の通りとする。
- 択一式の項目は左から「1」「2」「3」・・・と入力する
- 複数選択の項目は選択肢を列の見出しとし、該当する項目に「1」と入力
- ○×式の項目は○を「1」、×を「2」とする
- 2番は○の項目を「1」、他は空欄とする
ウィンドウ枠の固定
入力を行うにあたり、1行目に入力された見出しが見えていた方が、入力箇所がずれていないかどうか確認しやすい。しかし、スクロールすると上のほうは見えなくなってしまう。この場合、ウィンドウ枠の固定を行うと、指定した範囲はスクロールをしても常に表示されるようになる。
まず、固定したい行の下の行を選択する。1行目を常に表示させたい場合は、その下の行である2行目を選択する。A列を常に表示させる場合は、B列を選択する。
次に、メニューの[ウィンドウ]→[固定]を選択する。これで、スクロールをしても1行目は固定され、常に表示される。固定を解除したい場合は、メニューから[ウィンドウ]→[固定]を再度選択。
[12]本日行う作業について
アンケート結果を入力したデータファイルの処理をこれから実施していくが、最初から集計を行わない。最初に実施するのは、入力間違いの修正や除去といった作業である。これらの作業をデータの編集(エディティング)と呼ぶ。例えば以下のような作業がある。
- 白紙やすべて「1」のような調査用紙の除去
- 存在しない選択肢や数値は原票を再度調べる
- 原票で誤りがある場合は無回答にする
- 選択数(3つ選んで○を付ける等)に誤りがある場合は無回答にする
- 濾過的質問に矛盾している回答は無回答にする
- 字が読めない場合は無回答扱いにする
- 「その他」で具体的に記入している項目が特定の選択肢に該当する場合は、その選択肢を選んだものとする
5については、「車を運転しますか」に「いいえ」を回答し、その次の「前の質問で「はい」と回答した方に伺います」という質問で回答していた場合が該当する。この場合はどのように回答していたとしても無回答扱いとする。
今日はraw_data.odsのエディティングを行うが、原票がないので、入力間違いの可能性のある数値があっても調べられない。よって不適切な値があった場合は、その回答者の回答はすべて無効扱いとする。
[13]raw_data.odsを用いたデータ処理
本日配布したデータは、E列に1列(「2020年度」)追加し、2020年度履修者に「1」を入れている。これで、2009年次調査と2020年度履修者の区別ができるようになっている。
raw_dat.odsを用いた作業
- EJ列以降でcountblank関数を用いて、3番の21問と、4番の認知度10問と理解度30問に記入漏れがある回答者を調べる。該当する回答者は一行丸ごと黄色で塗りつぶす
- EJ列以降で、count関数とcounta関数を用いて3番、4番で数字以外の値(文字列)が入力されている回答者を特定する。該当する回答者は一行丸ごと黄色で塗りつぶす
- EJ列以降で、countif関数を用いて3番、4番以降で上限を超える値が見られる回答者を特定する。該当する回答者は一行丸ごと黄色で塗りつぶす
上記のうち、1番は回答者の回答忘れ、2番と3番は入力時の間違いであることが多い。2番と3番に該当する回答者のデータについては、本来は原票(元の質問紙)を確認する必要がある。今回は、原票を参照できないため、1番から3番に該当する回答者は無効扱いとする。
上記の作業により得られるデータ
- 3、4に回答漏れのあるデータ(countblank)
- 3、4に数字以外の文字列が入力されているデータ(counta-count)
- 3、4に0以下の数字が入力されているデータ(countif)
- 3に4を超える数字が入力されているデータ(countif)
- 4に2を超える数字が入力されているデータ(countif)
これらの無効データは、1行まるごと削除する。