合成音の「あぁ?」。

 今日の日記は、分かる人にだけ分かればいい話です。音声合成の話です。短い話です。つまらないです。

 私の研究の目的は音声合成ではないのですが、途中で合成の話が絡んできたのでそのことをちょこっと書きます。今回のミッションとしては、一つのスペクトルから人の声を合成するというものでありふれたものです。

 入力はこのスペクトルです。「あ」のスペクトルです。

 ほかにはなんらデータを使わず、データを使わないので機械学習もすることなく、いわばルールベースのやり方で音声を合成します。分析合成ではなく本当に合成ですね。

 で、これが合成音です。「あぁ?」という感じになっています。へー、こういう音になるんだなー、と思いました。人の声っぽく聞こえますかね。韻律は手動調整です。

 波形としてはこんな感じで、いたって普通の音声波形だと思います。

 というそれだけの日記です。たまには音声のことも書かないと将棋の話ばかりになってしまうので書きました。

 なお、最初の「あ」のスペクトルについてですが、「重点領域研究「音声言語」・試験研究「音声DB」連続音声データベース*1」という長い名前のデータベースの一つの音声のごく一部をお借りしています。

*1:板橋秀一「文部省「重点領域研究」による音声データベース」日本音響学会誌,48巻,12号,pp. 894-898 (1992)