基礎プログラミング I 第7回正規表現と Ruby 言語でのプログラミング「空白を利用してデータを取りだすには」 (講義ノート)

列のデータには同じカテゴリーのデータが含まれている。 station.dat なら、駅名、都道府県、かな、アルファベットと並んでいる。県に存在し、 ma または ta で終わる地名を探すには

%./std_regexp.rb station.dat 
検索パターン : (\S+県)\s+(\S+)\s+(\S+[mt]a)$

文字列の切り取りを復習しておこう。

`\S+`	空白文字以外の文字列が 1 個以上並んでいるものを探す
`\s+`	空白文字が 1 個以上並んでいるものを探す

これを組み合わせ、

県空白よみがな空白アルファベット [mt]a$

を作った。遠い位置にあるデータの条件とを組み合わせて検索することができるようになる。データの列と空白文字列を分解するとき、 () を使う。

% ./std_regexp.rb station.dat 
検索パターン : (\S+県)\s+(\S+)\s+(\S+[mt]a)$

と書くことにする。次にこのデータの列を切り出す方法を学ぶ。

上野駅から出発する。最後の駅が no で終わる駅を探したい。このように東京都に属する駅を除いて駅名を探すときにこれが使える。実際試し、何駅が検索されるか調べよ。

基礎プログラミング I 第7回 正規表現と Ruby 言語でのプログラミング 「空白を利用してデータを取りだすには」 (講義ノート)