修士のときに友人と「穴」について議論をしたことがある。穴を認識したいとして、一体どのように我々は穴を認識する認識器を設計すればいいだろうという議論である。私は音声について研究をしており、彼は言語獲得について研究をしていた。この穴の認識の問題は、文脈としては、パターン認識の問題である。また、議論が複雑になってしまうので、抽象的な意味での穴は除外し、物理的な穴の認識を目標とした。
まず、彼と私は様々な穴をホワイトボードに描いた。そこで簡単に分かったのは、穴には種類があるということである。国語辞典を引いてもそう書かれているのであるが、「くぼみ型」と「突き抜け型」である。例えば、地面に掘った穴とドーナッツの穴がそれに当たる。これらがなぜ同じ「穴」という言葉で表されるのかということも不思議だったのだが、とりあえず、どちらか一方でも穴であると認識できればよいということにした。
私も彼も機械学習を知っていたので、穴のサンプルをたくさん集めて学習させ、パターンマッチングさせるということを最初に考えた。これはすぐに「無理だろう」という結論に至った。穴という概念にはどう考えても物理的な典型例があるようには思えなかったからである。それから、数日間かけて、いろいろと考えた。水が溜まったらくぼみであるとか、光を無限遠から当ててみて影になったらそこが穴であるとか、そういうことである。そのほかにも様々なことを考えたのであるが、妥協案こそ見つかれど、決定打は見つからなかった。
一緒に学生食堂で夕御飯を食べているときも妙にマカロニが気になったり、フォークの先端は割れているがこれは穴だろうかと思ったり、先生が使っているコーヒーカップのカップ本体の部分は穴と呼んでよいものかと悩んだりした。
結局その問題はうやむやのままに卒業してしまったのだが、今にして思えばかなり面白い題材である。「穴には典型例がない」。「動き」もなくて、印象としてはあまり「多様性」もなさそうに思える穴であるが、実は驚くほどに「多様」であり、判断に迷う例もたくさんある。
ところで、上記の穴の話は物体認識の話であるが、音声についても似たような音がある。「っ」である。この「っ」は私が知る限りではかなり珍しい音素である。日本語を母語としない人が日本語を喋ると、「っ」の扱いがかなりおかしいことが多々ある。「っ」に該当する音は外語にはなかなか見当たらない。
この「っ」であるが、音声波形としては、振幅がゼロの無音となる。「あった」と発声するときには「あ」と「た」の間に無音が入る。また、「た」の発音が少々変形する。とにかく「っ」は無音である。
では、無音であれば「っ」になるかといえば、そんなことはない。例えば、「たけ」と発音するときには、「た」と「け」の間にすでに無音区間がそれなりに長く入っている。では、その無音区間が長引けば「たっけ」という発音になるかといえば、なるといえばなるが違和感のある「たっけ」となる。「っ」というのはよく分からないのである。無音であるにもかかわらず、音素として成り立っているのである。穴のような音素である。ただし、「っ」の場合は「典型的な『っ』」が存在する可能性もあると思っている。それから、「っ」の後続子音には変形が見られる場合が多いので、もしかしたら、後続子音の変形が「っ」なのかもしれない。そもそも「っ」などという音素は存在せず、子音の種類が本当は一般的な五十音よりも多いだけなのかもしれない。工学的には「っ」をどう解釈しておくのが妥当なのだろうか。