2018 Social Information Processing

品名	単価	在庫数
ピロリチョコ	150	200
キムチアイス	130	4000
コレラーメン	298	300

表1
Samp01	9	7	8	6	4	6	6	5	4	5
Samp02	5	9	5	8	8	5	10	9	4	8
Samp03	3	6	5	8	7	5	2	5	6	6
Samp04	5	3	7	2	8	3	3	5	3	5
Samp05	6	7	7	7	4	8	3	3	7	7
Samp06	5	5	5	9	6	6	7	5	6	1
Samp07	6	7	6	5	5	6	6	4	5	8
Samp08	5	3	6	6	4	2	6	4	7	5
Samp09	2	4	4	4	6	7	10	4	7	7
Samp10	5	5	4	6	6	4	4	6	1	6

表1の10個の標本それぞれについて，平均，分散，標準偏差を求めよ。

複数の標本がある場合はデータフレームに入れて処理するとよい。まず，表1のデータ部分を領域選択して clipboard にコピーし， read.table で読み取る。

tmp <- read.table("clipboard")
tmp
       V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
1  Samp01  9  7  8  6  4  6  6  5   4   5
2  Samp02  5  9  5  8  8  5 10  9   4   8
   (中略)
10 Samp10  5  5  4  6  6  4  4  6   1   6

データ部分(V2～V11)を抽出し，さらに転置する(行と列を入れ換える)。

tmp2 <- t(tmp[,-1])
tmp2
    [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
V2     9    5    3    5    6    5    6    5    2     5
V3     7    9    6    3    7    5    7    3    4     5
V4     8    5    5    7    7    5    6    6    4     4
   (中略)
V11    5    8    6    5    7    1    8    5    7     6

これをデータフレームに変換し，列の名前を付ける。列の名前は tmp 変数の1列目を利用する。

sip1 <- data.frame(tmp2)
names(sip1) <- tmp[,1]
sip1
> tmp3
    Samp01 Samp02 Samp03 Samp04 Samp05 Samp06 Samp07 Samp08 Samp09 Samp10
V2       9      5      3      5      6      5      6      5      2      5
V3       7      9      6      3      7      5      7      3      4      5
V4       8      5      5      7      7      5      6      6      4      4
V5       6      8      8      2      7      9      5      6      4      6
V6       4      8      7      8      4      6      5      4      6      6
V7       6      5      5      3      8      6      6      2      7      4
V8       6     10      2      3      3      7      6      6     10      4
V9       5      9      5      5      3      5      4      4      4      6
V10      4      4      6      3      7      6      5      7      7      1
V11      5      8      6      5      7      1      8      5      7      6

なお，転置する作業までを表計算ソフト上で行なってもよい。データフレームに入れば，平均，分散，標準偏差も分かりやすく得られる。

(平均)
mean(sip1)
Samp01 Samp02 Samp03 Samp04 Samp05 Samp06 Samp07 Samp08 Samp09 Samp10 
   6.0    7.1    5.3    4.4    5.9    5.5    5.8    4.8    5.5    4.7 

(分散)
diag(var(sip1))
  Samp01   Samp02   Samp03   Samp04   Samp05   Samp06   Samp07   Samp08
2.666667 4.544444 3.122222 3.822222 3.433333 4.055556 1.288889 2.400000
  Samp09   Samp10
5.388889 2.455556

(標準偏差)
sd(sip1)
  Samp01   Samp02   Samp03   Samp04   Samp05   Samp06   Samp07   Samp08
1.632993 2.131770 1.766981 1.955050 1.852926 2.013841 1.135292 1.549193
  Samp09   Samp10
2.321398 1.567021

※問題:
diag() は何をする関数か?
また，diag() に渡さずに var(sip1) した結果はどうなるか?

`sqrt(x)`	二乗根
`abs(x)`	絶対値
`log10(x)`	常用対数
`log(x)`	自然対数
`round(x)`	四捨五入
`ceiling(x)`	引数以上の最小整数
`floor(x)`	引数以下の最大整数
`trunc(x)`	小数切り捨て

`mean(x)`	平均
`var(x)`	不偏分散
`sd(x)`	不偏標準偏差

Rの基本的使用法

起動と終了

変数と基本データ型

変数

式とベクトル

行列

関数

データフレーム

データフレームとは

ファイル入出力

基本統計量の算出練習

練習問題

Rへのデータ入力のポイント