基礎プログラミング I
第06
回
正規表現と検索
何回か繰り返されている文字を探したい
ドイツ語やフランス語では、英語のアルファベットしかないときに、
特殊記号をアルファベット 2 文字を使って代用することがある。
しかしその規則は、
ドイツ語にかなり似ており、
フランス語から多く語彙を持ち込んだはずのスウェーデン語にはない。
この規則を知らないドイツ人やフランス人が、
コンピュータを使用してスウェーデン旅行の情報を得ようとするかもしれない。
またオランダ語では、繰り返して綴る発音が多いが、発音がかなり英語に近いため、
オランダ語で探すべきものを英語風の綴りで検索してしまうかもしれない。
そのような検索でもヒットするには、次のようにする。
"*" (asterisk) : 直前の文字が出現してもしなくてもよいが、出現は何回でもよい場合
stras*e | HIT |
strae, strase, strasse, straek, strassen |
"+" (plus) : 直前の文字が出現しなければならず、その出現は何回でもよい場合
ec+o | HIT |
eco, ecco, ecology, economy, deco, record, pecco |
先頭あるいは末尾が分かっている場合
"^" (caret) : 先頭の文字列のみ探して調べる
cita | HIT |
cita, citation |
OUT | paque de la cita, cinecita |
"$" (dollar) : 末尾の文字列のみ探して調べる
casa$ | HIT |
le bois de la casa, micasa |
OUT | acasaca, casa blanca |