「べ」と「で」と「げ」の違い・その2、およびその前置き。

 本日は音声の話である。前半は一般論だが、後半はマニアックな話である。

 音声工学の歴史はわりと浅い。長く見積もっても百年であり、短く見積もると五十年くらいである。その五十年の歴史をさかのぼると、最初に手作業で試行錯誤していた時代があり、徐々にコンピュータが威力を発揮し始め、そして二十年ほど前に機械によるパラメータの自動学習が本格的に始動した。つまり、現在の技術の原型は二十年ほど前からあまり変わっていない。この話は先日Ustで中継された音響学会のプレイベントでも触れられた。

 そこから先の論調は大抵「これからどこに行けばよいのか」という問いかけになるのだが、それはおそらく歴史を振り返るという罠にはまっている。確かにそれぞれの年代によって研究のメインの課題は変わっていっただろうが、古い年代にあった研究課題は決して時代遅れになったわけではなく、もしもその頃の問題がまだ解決されていないのなら、当然現在においてもその研究はおこなわれるべきである。

 では、このところ研究の主流から外れているもののいまだに解決されていないものは何なのか。その一つが子音である。ほかにも多くの未解決課題はあるが、大抵それらはメインの研究課題だとみなされている。子音のような基礎的な部分がぽっかりとメインから外れている。海外に目を向けるとconsonant challenge(子音チャレンジ)なるものがあり、一見子音について一生懸命に研究されているようにも見えるが、実際のところ母音にも使う手法を子音にも当てはめようとしているだけである。そうではなく、子音ならではの何かを見つけなければならないのだと私は思っている。

 子音についてのことは「ゆっくり」の声でお馴染みのアクエストの人がブログにもつづっている。

しかし、この分野に携わる研究者は、未だに音韻を弁別する物理的特徴が明確になっていないという事実を、常に頭の片隅に置いておく必要があると思います。
例えば、/p/、/t/、/k/のこれら音韻の物理的特長の違いを示せといわれて、ちゃんと答えられる人がいるのかな?どこからも歯切れの悪い答えしか得られないのが現状ではないでしょうか。

コーパスベースの音声合成

 音声合成の開発者が、「何を合成しているのか分からない」と言っている構図である。私はもう研究者とは自称していないし(学会は見に行っていますが)、この方もおそらく世にいうところの研究者ではない。そういう人からばかり子音の話が出て、なぜ研究者からこういった話が出ないのかというと、ひとえにそういう研究はコストパフォーマンスが悪いからである。とり組んでもなかなか芽が出ない上に、成果が出たとしても前述したように「昔の課題」なのでまともに学会で相手にされづらく、論文になる可能性は低い。研究計画が立てづらいので予算もつきづらい。ゆえにごく少数の研究者しかとり組まないのである。

 では、誰もとり組んでいないのかというとそんなことはなく、日本人では「つ」と「す」の違いについて研究している研究者もいる。素人目に見ても玄人目に見ても、工学的にはなんだかしょぼい研究課題に映るかもしれないが、このあたりを徹底的に追究することが子音解明への突破口になるかもしれないのである。誰もがやりたがらないが誰かがやらなければならない重要な研究である。また、工学系ではなく、言語学系の研究者は結構このあたりを熱心に研究しているようだが、詳しいことは知らない。

 ここまでが前置きである。ここからマニアックな話になる。

 私は/b/と/d/と/g/の違いがどこにあるのかということを研究している。この三つは言語学的には調音位置(平たくいうと口の上と下が狭まる位置)が違うということになっている。それ以外の特徴は一緒であるということになっている(私の文系の音声学の理解も大雑把だが)。

 ならば、この三つの子音の調音位置の違いは、物理的には(音波としては)どこに現れてくるのか。さすがにこのあたりは昔からある課題だけに通説もあるが、丁寧に検証していくとその通説の怪しさが見えてくる(第二フォルマントがどうのこうのというやつである)。

 こういう問題にどうアプローチするのかも難しいところなのだが、私がいろいろと試行錯誤した結果、/bi/の音声信号から/di/に聞こえる音声信号を作る手法を編み出すことに成功した(七名のデータ全員で成功している)。だからといって、そこが/b/と/d/の違いなのかというと決してそんなことはなく、同じことをしても/ba/が/da/にはならないのでやはり違いではないのだが、違いに到達するための何かを手に入れたという確かな手応えがある。誰かが見つけなければならない鍵の一つである。

 以下、音声である。

D

 なお、手法についてはメールでの要望が多ければこのブログに書く。変換用のスクリプトは、メールに入手希望理由を書いていただければ、無料で送るつもりである。それから、誰か学会で発表したい人がいたら、代わりに喋っておいてください。