roy > naoya > 実用情報 > (6)表計算[1] 効率的なデータ入力
(6) 表計算[1] 効率的なデータ入力
[5]後半の作業について
後半の授業では、表計算ソフトを使ってデータ処理を行う場面を想定し、基本操作に加えて知っていることが望ましいテクニックについて適宜確認していく。
表計算ソフトの初回として、本日はデータ入力について学ぶ。名簿を作成する場合、データをどのように入力すればよいだろうか。また、アンケートの結果はどのように入力すべきか。全ては入力後の処理方法によって決まってくる。不適切な入力方法をしていると、並び替えが出来なかったり平均値や合計が求められなくなる。今回は、アンケートを題材に入力方法について考えていこう。
[6]考えてみよう
以下の架空のアンケートを実施し、結果を入力するという状況を考えてみよう。皆さんであればデータをどのように入力するだろうか。実際にCalcに入力してみよう。以下は1人分の結果であるが、実際には300人分のデータがあると仮定する。
公益大オープンキャンパス来場者へのアンケート(架空)
1.性別
男 ・ 女
2.学年
1年生 ・ 2年生 ・ 3年生 ・ その他( )
3.オープンキャンパスを何で知りましたか(複数回答可)
ホームページ ・ パンフレット ・ 学校の先生 ・
知人から ・ 家族から ・ その他(リーフレット)
4.オープンキャンパスを通して大学について知ることができましたか
はい ・ いいえ
5.公益大に関心を持ちましたか
全く持たなかった ・ あまり持たなかった ・ どちらでもない
やや持った ・ 非常に持った
6.その他感想がありましたらご記入ください
ありがとうございました。
次回も参加したいと思います。
[7]データ入力の考え方
入力方向
データ入力の大原則は、1人分のデータは1行で入力するということである。2行にまたがってしまうと、並び替えを行うことが出来なくなるためである。また、1人分のデータは1列(縦方向)ではなく1行(横方向)で入力することが望ましい。
エクセルの行と列はそれぞれ以下の通りである。
- 列:AからAMJの1024列
- 行:1から1048576の1048576行
各自のデータを1列(縦方向)に入力すると、1024人分しか入力できないが、1行(横方向)で入力すれば1048576人まで対応できる。
なお、データ入力後、[Enter]を入力するとアクティブセルが下に移動してしまうため、いちいち隣のセルに移動しなければならず手間がかかる。アクティブセルを横に移動させる方法もあるので覚えておくと良い。
- 入力後[Enter]:アクティブセルは下に移動
- 入力後[Tab]:アクティブセルは右に移動
性別・学年(択一式)
性別や年代のように該当するものを1つだけ選択する場合、表計算ソフトには回答した項目を入力するが、その際、「男」「女」ではなく、「1」「2」のように、数字に置き換えて入力すると良い。日本語は変換が必要であり、入力文字数も多いため時間がかかる。「1」や「2」と入力しておいた方が時間がかからないし、その後の集計も容易である。必要とあらば、入力後に「男」「女」に一括で置換することもできる。
今回は、学年に「その他」の項目がある。「1年生」「2年生」「3年生」は順番に「1」「2」「3」とすればよいが、「その他」はどうすればよいだろうか。この場合は、2つの方法がある。
- 「その他」に該当する人数が少ない場合や具体的な記載内容がほとんど同じ場合:「4」でOK
- 「その他」に該当する人が多い場合や具体的な記載内容が多岐にわたる場合:()内に記載された内容をそのまま入力する
オープンキャンパスを知った理由(複数選択)
複数回答可の質問を作成した場合は、どのように入力すればよいだろうか。例えば、次のように入力したとしよう。
A | B | |
1 | 知った理由 | |
2 | パンフレット | |
3 | パンフレット、家族から | |
4 | 学校の先生、知人から | |
5 |
これは、1人目が「パンフレット」を選び、2人目が「パンフレット」「家族から」を、3人目が「学校の先生」「知人から」を選んだということをあらわす。
これは正しくない入力方法である。このような入力を行っても、その後の分析を行うことが出来ない。各項目ごとに集計を行おうにも、これでは集計のしようがない。1つのセルには1つのデータのみ入力するべきである。
では、これならどうだろうか。
A | B | |
1 | 知った理由1 | 知った理由2 |
2 | パンフレット | |
3 | パンフレット | 家族から |
4 | 学校の先生 | 知人から |
5 |
今度は、複数項目を選択した場合に、2つ目の項目を隣のセルに入力している。これならば、1つのセルに1項目を入力しているので、後で項目ごとに回答数を集計して求めることはできる。しかし、これも最適解ではない。この入力方法で、それぞれの選択肢を選んだ人数を調べるのは、不可能ではないが、かなりの手間である。もっと簡単な方法がある。
最後にその方法について見てみよう。
A | B | C | D | |
1 | パンフレット | 学校の先生 | 家族から | 知人から |
2 | 1 | |||
3 | 1 | 1 | ||
4 | 1 | 1 | ||
5 |
ここでは、1行目に選択肢を記載しておき、それぞれの回答者が選んだ項目に「1」と入力している。このような形式にしておけば、入力後、1の数を数えれば(具体的には今後学ぶsum関数を用いて合計を算出すれば)各選択肢を選んだ人数がわかる。sum関数は使用法が簡単な関数であり、入力時も単に「1」と入力すればよいので、簡単である。
大学への関心の有無(5段階評価)
5段階評価の場合はそれぞれに1~5の数字を割り振ればよい。7段階評価の場合は1~7を割り振る。「どちらでもない」を0として、5段階であれば、-2~2とすることもあるが、どちらの方法でも同じことである。ただし、マイナスがあると入力キー数が「-」と数字の2つになるので1~5の方が楽である。
なお、1~5のように数字を割り振る場合、5段階の両端の「全く関心がない」と「非常に関心がある」のどちらを「5」にすればよいだろうか。これは、質問の方法に依存する。満足度調査であれば、値が大きいほど満足しているという結果の方が分かりやすいし、不満度調査であれば、値が大きいほど不満である方が分かりやすい。目的に応じて使い分け、値を見たときに、その値の意味がスムーズに理解できるようにしよう。
ところで、5段階評価が複数項目ある場合はどうなるだろうか。例えば、「全くあてはまらない」「あまりあてはまらない」「どちらでもない」「ややあてはまる」「非常にあてはまる」という5段階評価の質問の場合において、次のような質問が行われたとする。
- コンピュータの画面を見るだけで嫌な気持ちになる
- コンピュータに関する知識を身に付けたいと思う
これらで、それぞれ「非常にあてはまる」を選択した場合、両者が持つ意味は異なっている。1番はコンピュータが嫌いということであるが、2番は好きだということをあらわす。両方とも「非常にあてはまる」だから「5」と入力し、両者の平均値を算出すると、結局のところ、出てきた値は何を意味しているのか分からなくなる。
仮にこれらの項目で「コンピュータへの忌避感」を調べたいのであれば、値が大きいほどコンピュータが嫌いであることを示した方がよい。この場合、2番は値が大きいほど好きであるという意味になってしまうので、逆転項目(反転項目)と呼び、通常項目とは異なる処理をする必要がある。
具体的には、通常項目は1~5の順で入力するが、逆転項目は5~1というように評点を逆転させて入力する。これにより、平均値を見た際に値が大きいことがコンピュータへの忌避感をあらわすことになる。
ただし、最初にデータを入力する段階で、1~5で入力する項目と5~1で入力する項目が混在していると、確実に入力間違いが発生するので、最初は一律で1~5で入力しておき、入力後に逆転項目は一斉に置換を行って、1~5を5~1に置き換えるのが一般的である。
自由記述
自由記述は、内容を要約したりせず、書かれているまま入力する。ことばから感情を読み取ることが出来るからである。文字数が多くなるが、1つのセルに頑張って全部入力する。改行が行われている場合、次のセルに入力するのではなく、そのまま1行で入力するか、Alt+Shift+[Enter](エクセルはAlt+[Enter])を入力し、セル内で改行する。
[8]練習
実際にデータ入力を行ってみる。入力の練習をするためにはある程度項目数の多いアンケートを利用することが望ましい。
今回は、コンピュータの利用不安に関する質問紙調査を実施しその結果を分析する。2009年に同調査を200名規模で実施したことがあり、その結果に2020年の情報リテラシー受講者である皆さんの結果を追加する。実際に各自で調査に回答し、自分の結果をCalcに入力してみよう。その際に、どのように入力をするかという点については、今回の授業の内容を踏まえること。入力したデータは添付ファイルで提出する。
提出されたデータは1つのファイルにまとめ、2009年のデータと合算した上で、次週配布する。今後の授業ではこのファイルを使いながら作業を進める。
提出要領
完成したら3_学籍番号.odsという名称で保存し、添付ファイルで提出する。メールの本文には感想を書く。
- To:naoya@e.koeki-u.ac.jp
- Subject:アンケートデータ提出