音声認識の問題と計算機の能力。

 たまに「今のコンピュータでは音声認識は実現不可能だ」と主張する人がいる。特に専門外の先生にこういった主張をする人が多い。よくある論調としては、NP困難のからみで、人間と今の計算機では解の導き方が違うのだとするものが挙げられる。確かに、解の導き方は違うのだろうが、そこから「音声認識は実現不可能」とするのは無理がある。また、その論調の延長上に「量子コンピュータが開発されれば認識問題はずっと楽に解決できるだろう」と予想する人もいるが、やはり専門外の人には問題の複雑さが把握できないのだと思わざるを得ない。

 量子コンピュータでできるといえば(今度は私が専門外になるのだが)、並列探索の問題が解決できるということである。けれど、それができるからといって音声認識の問題が一気に解決されるかといえばそんなことはない。計算は確実に速くなるだろうが、精度は全く変わらないだろうことが予想される。要するに、探索法の問題と認識精度の問題は全く独立の話である。いくら計算機の計算速度が向上したところで、計算手法が改善されなければ性能は改善されない。計算機と人間で解の導き方が違うと主張したところで、どのように違うのかを明らかにしなければなんの進歩も見込めない。

 また、今の計算機で音声認識が実現不可能かどうかはまだ誰にも分かってはいない。そもそも、どのようにすれば人間と同じ性能の認識機が作れるのかは不明である。その状態で「実現不可能」と断言することはできない。

 ところで余談だが、人間は本当に量子コンピュータのような並列探索をしているのだろうか。私の頭では、例えばナップザック問題のような問題はやはり今のコンピュータと同じようにしらみつぶしにしか解けないのであるが。