初音ミクなどの音声合成のしくみ。

 初音ミクという歌声合成ソフトが売り出されてから約半年が経つ。その間、様々な初音ミクに対する言説を見てきたが、社会的・心理的・哲学的な観点からの言及ばかりで、科学的な観点からの言及が少なかったので、科学的な観点から簡単な解説を書いた。絵本を読むようなつもりで眺めていただければ幸いである。

 リンク先のページに誤りがありましたので、訂正記事にて訂正させていただきました(2008年3月26日)。

 初音ミクとかの音声合成のしくみ

 また、音声合成ではなく、音声認識についてもかなり前に書いたので、合わせて読んでいただけると幸いである。

 音声認識のしくみ

 簡単にしか書いていないので、詳しいことを知りたい方は、専門書を読んでください。板橋先生の本には音声のことが情報工学的な観点から詳しく書かれており、古井先生の本には物理的な音波としての音と情報工学的な音声のことが半分ずつくらい書かれています。どちらも理工系学部の三年生以上の人なら読める入門書だと思います。

 荒木先生の本は読んだことがないのですが、フリーソフトの使い方など、かなり実用的な本のように思えます。また、amazonで目次を見たかぎりでは、パターン認識の基礎・学習理論の基礎・音声認識の基礎について触れられているように見えます。ただし、音声合成については少ししか書かれていないようです。理工系の大学に入りたての人向けの難易度でしょう。新書のようにはすらすらと読めないと思いますが、プログラミングの入門書程度にはすらすらと読めると思います(繰り返しますが、私は手にとったことがありません)。

 なお、アフィリエイトはおこなっていないので、買っても私の利益にはなりません。

新音響・音声工学

新音響・音声工学

音声工学

音声工学

フリーソフトでつくる音声認識システム パターン認識・機械学習の初歩から対話システムまで

フリーソフトでつくる音声認識システム パターン認識・機械学習の初歩から対話システムまで

 ところで、音声認識について一般向けの新書と同じくらいやわらかい感じの本が書きたいのですが、どういうふうに企画を持ち込んだらいいんでしょうか。

 昔のラジオはねじ回しがあれば中身を見ることができたが、今のソフトは中身を見ることができない。