Abstract

我々は, テキスト音声合成システムのポーズ挿入精度向上のために, 言語処理部に構文解析処理を導入し, 一文全体の係り受け解析結果を利用したポーズ挿入処理を試みた. 本稿では, この結果について報告する. テキストを音声に変換して出力する際には, その内容を感覚的, 意味的に捉え易くするために, テキスト中の適当な位置に適当な長さのポーズを与える必要がある. ポーズ位置やポーズ長の設定に, 対象文の係り受け解析結果が有効な手がかりになるとの知見が得られているが, 従来は実施上の都合から, 語彙情報の利用や, 局所的なテキスト解析による方法が代用されていた. そこで本稿では言語処理部に軽量かつ高速な構文解析系を導入し, 一文全体の係り受け解析のシステム上での実現を試みた. ポーズ挿入の生じ易さの指標としてポーズ挿入尤度を設け, 係り受け情報に着目したポーズ挿入規則に基づき, 全文節境界にポーズ挿入尤度を設定する. 尤度の高い境界から基本ポーズ長レベルを設定した後, 各境界に対してアクセント結合処理および呼気段落に基づく閾値による調整を行なう. 実際にテキスト音声合成システムに実装し, 形態素解析と隣接間係り受け処理のみ実装しているテキスト音声合成ソフトウェアパッケージとの比較実験を行なったところ, ポーズ挿入精度の大幅な向上が得られ, その効果を確認することができた.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call