区切り。

 十年単位のきりのよい日なので、これから十年間でやってみたいことを列挙する。全てできるとは思わないが、まあ、羅針盤のようなものである。五年くらい経ったら全く違ったことをしている気もする。

 とにかく続けたいのは、子音についての研究である。このブログで何回も語っていることではあるが、今の音声工学というのは母音中心の理論であると見受けられる。そして、その母音の理論を子音に強引に適用している印象がある。子音に特化した理論をうまく作りたいと思っている。これは執念深く続ける。

 音声についての時間の研究もしてみたい。音声でおそらく最も難しいのは、音声波形の時間的な伸び縮みにどう対処するかという問題である。これはすでにDPマッチングやHMMで対処されていることではあるが(このあたりが音声工学の歴史の一番の成果だと思う)、理論が入り組みすぎていると思う。もっとすっきりとした解決法を模索したい。ただし、まだ構想段階である。

 伝達関数によるひずみや、話者性についての研究もしたい。音声は同じ言葉でも話者や伝送路が異なると波形の性質が変わる。同じ言葉の場合、何が同じで何が異なるのかということを明確にしたい。これは構想すら始めていない。

 図が中心の音声認識の本を書きたい。すでに簡易版は数年前にウェブページにアップロードしているが、あれの詳細版が書きたい。本が無理ならウェブにアップロードする。これはこつこつと作業すれば終わる話なので、そのうち実現すると思う。文面の初稿はあらかた書き終えているのだが、図が中心なので完成はまだまだ先である。

 音声合成をしてみたい。世にたくさん音声合成のソフトは出回っているが、自分なりに作ってみたい。これは研究ではなく趣味である。まだ作り始めたばかりで、完成にはほど遠いのだが、こんな声質にしたいというのはある。ちょっと変わった音声である。

 モンテカルロどうぶつしょうぎを強くしたい。現在も進めていることではあるが、モンテカルロ法をなんとかして自分の納得するかたちで将棋に適用したい。今月か再来月に公開しようと思っているバージョンは、min-maxの5手読みといい勝負をしてくれることもある。どうぶつしょうぎは非常に実験しやすいのだが(ルールが単純で盤がせまい)、ソースの公開に問題が生じるのが困るところである(公開してもLPSAから怒られないだろうか)。5五将棋だと、まだ盤が広すぎる。

 それから抽象的な話であり、十年以上のスパンの話ではあるが、体力がない人なりの生き方を模索していきたい。mixiに「疲れやすい」というコミュニティがあり、私はそこには入っていないのだが、「朝起きたときにすでに疲労している」「50m走れない」「食べると疲れる」など、共感できる書き込みがたくさんある。自分なりにこれらの難題とあらためてつきあっていきたい。