フィクションの中の音声工学。

 先日、知り合いが「踊る大捜査線」のスピンオフの「交渉人 真下正義」を見たと言っていた。そのときに「最近の警察って音声からぱぱっと犯人を割り出せちゃうんだねえ」とも言っていた。どうやら、あれがフィクション内の誇張表現だとは思っておらず、作中で表現された技術がそのまま実行可能だと信じ込んでいるようだった。

 さて、まずは「交渉人 真下正義」に出てくる音声の技術の中から二つほど紹介しよう。一つは、ボイスチェンジャーによって変換された音声を逆変換して完璧に元に戻すというものである。もう一つは、犯人の声を過去のデータベースから探してそれが誰であるかを特定するというものである。作中ではこの二つの技術によって犯人を割り出している。

 一つ目のボイスチェンジャーについては、逆変換はほぼ不可能である。作中では、どのようなボイスチェンジャーが使われているのか分からない状態で音声を復元しているが、その場合は絶対に不可能である。もし復元を試みるなら、犯人が使ったボイスチェンジャーの特性を手に入れなければならないのだが、手に入れられたとしても自然に聞こえる音声を復元するのはまず無理だと思ってよい。

 では、ボイスチェンジャーを使われてしまった場合にどう対処すればよいのかということだが、実際のことは警察に訊いてみないと分からない。私なら、音声を復元することはしないと思う。犯人を捕まえたあとで、同じボイスチェンジャーを使わせて、電話で録音した声と同じになるかを調べるのが手っ取り早くて確実なのではないかと思う。

 次に、音声照合の話だが、これはそこそこできる。ただし、作中の表現のように、「見つかりました。この人です」と一人だけ確実に突き止められるわけではなく、実際には機械が何人かの候補を出したのちに結局は人間が目と耳で「きっとこの人なのだろう」と判断することになる。また、データベースの走査を途中でやめることはなく、最後のデータまで調べあげなければならない。

 なお、少し難しい話になるのだが、ボイスチェンジャーで変換された声をデータベースと照合する場合、作中のように元の声に戻す必要はない(戻せるなら作中の戦略でもよい)。それよりも変換されたままの声から話し手の特徴を分析してデータベースから検索した方が話が早い場合もある。元の声に戻してから照合するか、戻さずに照合するかは技術者次第だが、この映画の場合にはボイスチェンジャーの特性が分からないので、戻さずに照合する方が適しているのではないかと思う。

 こういったフィクション内での警察の技術の誇張の話は音声処理技術だけにとどまらず、画像処理技術やその他の技術にもいえる話であるらしい。現実を知る人たちの間では、「フィクションに出てくる警察の情報処理能力の高さは異常」ということになっている。ただ、まあ、情報処理能力が高いと思われていた方が、犯罪防止のためにはよいのかもしれないけれども。