Abstract

表現豊かな合成音声への応用を目的として, 「喜び」と「悲しみ」の2種類の感情について複数の程度の感情情報を含む音声に対し, 基本周波数パターン生成過程モデルに基づく韻律的特徴の分析を行った.分析により得られた各モデルパラメータの生起タイミングおよびその大きさの変化に関して, 発話の言語的情報に基づき検討を行った.その結果, 基底周波数に関しては, 発話内容に依存する傾向の差は特にみられず, 「喜び」「悲しみ」とも感情の程度が強くなるに従って, 基底周波数は高くなる傾向にあった.文中でのフレーズ指令の生起に関しては, 文節境界の枝分かれ種別と, 直前のフレーズ指令以降のモーラ数に影響を受けることを確認した.フレーズ指令の大きさ関しては, その生起位置が文頭の場合と文中の場合とで, 感情の程度に対する大きさの変化に違いがみられた.また, 文中で生起したフレーズ指令は, その境界の枝分かれ種別により, 異なる変化の傾向がみられた.アクセント指令の生起タイミングは, 感情の有無やその程度の影響はほとんど見られず, アクセント型にのみ依存することが確認された.アクセント指令の大きさに関しては, 文頭からの韻律語数に大きな影響を受け, またアクセント型による違いがみられた.

Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call