情報交換概論 第 10 回 (LaTeX の基礎 ) 「Espeak の辞書の書き換え」 講義ノート目次

Espeak の辞書を書き変える。NetBSD では mbrola が動かないため、 espeak の fi, ru, Zhu, en, it, se などの辞書をもとに作成した。

dictsource/ja_list 単音のルール、 dictsource/ja_rules 連音のルール、 dictsource/ja_extra はひらがな音のルール、 phsource/ph_ja は音の種類。 ただし、phsource/ph_ja を読ませるためには voices/ja を作成、phsource/phoneme を追加する必要がある。

上記ファイルを適宜編集して日本語を喋るように変更した。

ひらがなファイルでは

nkf -w ファイル名 | espeak -v ja -w %w -s190

で確認できる。 -s は速度。

ja_list, ja_rules は現在のところ kakasi を通して話すようにできているが、 本来の仕様としては UTF-8 をそのまま話すべきものである。 また、どうやらもとのシンセサイザはイタリア語から派生しており (音をそのまま綴ることでは似たような特性を持っているためと想像される)、 アクセントがイタリア語的となっているのでこの点は改善が必要。

phsource/ph_ja で発音記号の制御、 voices/ja で日本語発音の定義を行う。

ja_* および ph_ja は未完成。

必要なファイルだけつくっておけば動く設計にしてあるべきだとも思われるが、 rsync 等で source と espeakedit にあるディレクトリをそのまま移植する必要がある。 UTF-8 コードは全ての文字をひとつの文字コードで表すように設計されており、 似た発音は使い回す手法を取っているためである。(CJK などもこれにあたる)

Web サイト読み上げ

espeak -m で読み上げ可能。(kakasi でひらがなにする必要はある。)