基礎プログラミング II 第 4 回 (繰り返しは引っ張りだそう) 「データの切り取りかた」 講義ノート目次

データを切り取るには正規表現を用いた。データは、 *.dat あるいは *.txt というテキスト形式のデータで、 1 行には特定の情報が順に並べられている。同じ列には同じ属性のものが入る。 名簿などの場合、氏名と 5 教科の成績、などであった。 文字列は \S+, 空白文字列は \s+, 整数値は \d+ で切り取った。


if /(\S+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)\s+(\d+)/ =˜ 変数
   配列や Hash への分解
end

配列では、氏名は name, 成績は japanese, english, ... に入れることにすると


name[0] = $1
japanese[0] = $2
english[0] = $3
:

Hash では、データが


白米      5000
玄米      1000
黒ごま     200

であるとき、

shop[$1] = $2

とプログラムでデータを処理する。 value はそのままでは文字列として処理した。