基礎プログラミング I 第 6 回 (正規表現と検索) 「ひらがなを検索するには」 講義ノート目次

日本語である範囲にある文字を検索したいときについて学ぶ。

ひらがなを探す

ひらがなを探すには、限定する [ - ] と Kinput2 を組み合わせる。 例えば、駅名がひらがなから始まるものを調べるときには次のように行う。

%egrep "^[ぁ-ん]" station.dat
かみのやま温泉山形県かみのやまおんせんKaminoyamaonsen
さくらんぼ東根山形県さくらんぼひがしねSakuranbohigashine
あつみ温泉山形県あつみおんせんAtsumionsen

小さいあ 「ぁ」 は la とすると入力することができる。

漢字を探す

常用漢字を探すには

%egrep "[亜-腕]" station.dat

とする。特殊な漢字(常用漢字でないもの)に関しては、文字コードの知識が必要である。

漢字を含んだ行たちだけを取り出すことができるようなデータの列を考え、 実行せよ。