パターンらしさ測定とパターン認識。

 実はいまだに「完璧な鳥」という話題について考えている。「完璧な鳥」というのはこのブログの最初の頃に書いた話である。そして、人工知能学会の査読に落ちた話でもある。この話で査読を通そうとは思わないが、看過してはいけない話でもある。概要としてはこんな論文を投稿した。

 現在のパターン認識は、まず、入力がモデルにどれだけ合致するかという尤度やそれに準ずるものを測る*1。次に、その尤度が最も高かったモデルを探して出力パターンとする。ところで、あるモデルに対する尤度を測るということは、入力が複数存在する場合にそのパターンにどれくらいふさわしいかという序列を測ることができるということである。例えば、「鳥」というパターンを表現するモデルが存在すると考えると、あらゆる鳥に対して「序列」をつけることができるということである。ツバメとスズメのどちらがより鳥であるかということを測ることできるということである。同様に、紅玉と藤のどちらがよりリンゴであるかということを測ることができるということである。果たして、入力に対して序列を作ることができる現在のパターン認識の考え方は妥当なのだろうか。現在のパターン認識は、パターンを扱っているのではなく、「パターンらしさ」を測っているだけなのではないか。鳥ではなく鳥らしさを測り、リンゴではなくリンゴらしさを測っている。現在のパターン認識は、「パターンらしさ測定」に過ぎない。

 上記の考え方は、何かがおかしいはずである。しかしながら、何がおかしいのかは分からない。査読委員は五人いたが、「論旨に矛盾あり」という理由で落とした方はいらっしゃらなかった。私も論旨のどこかに矛盾があるような気がするのだが、何が矛盾であるのかを明確に語ることはできない。

 現在のパターン認識というのは、天気予報に似ている。晴れと曇りと雨の確率を計算して提示しているだけである。そして、天気予報ならば、出力が確率であっても誰も怒り出す人はいない。けれど、目の前に存在する明らかにスズメである物体について「これは93%の確率で鳥です」と言ったら、馬鹿にされるだけである。現在のパターン認識はどこかで問題をとり違えてしまっているように思えるのであるが、どこで問題をとり違えてしまっているのかは分からない。

 ところでなぜ今ごろになって再びこんな話をしているのかといえば、昨夜の『爆笑問題のニッポンの教養』で哲学者が蛇について語っていたからである。

 蛇がいたとする。その蛇が「白かった」とする。このとき、「可愛い」と思う人と「怖い」と思う人の両方が存在するかもしれない。この「可愛い」と「怖い」は「心」に属し、「白い」は「世界」に属する。

 そういう趣旨のことを話していた。では、「蛇」は「心」と「世界」のどちらに属するのか、と私は疑問に思った。パターン認識をするにあたり、最も認識しやすいのは「白い」である。「白さ」というのはスカラー値で表すことができるので、例えば「236/256の白ですね」などとグレースケールで表してもおかしくはない。そして、機械はそういう測定が得意である。それから、「可愛い」「怖い」についても、それぞれスカラー値で表すことができる。「機械はこの物体に対して80%の可愛さと37%の怖さを感じている」と言われてもさほどの違和感はない。機械は(単純にプログラムされたものでもよければ)主観を持つことができる。ところが「蛇」はそうはいかない。蛇はパーセントで表すものではないからである。実はパターン認識にとっては、「白い・可愛い・怖い・蛇」の中では「蛇」が最も出力に困る。おそらく番組に出ていた哲学の先生は「蛇」を「世界」に属するものと捉えているだろうが、パターン認識屋である私にとっては「蛇」は、客観的に決めつけることができないという意味で「心」に属するものなのである。

 昔、村上春樹は『四月のある晴れた朝に100パーセントの女の子に出会うことについて』という短編を書いた。すでに題名に出てきているが、「女の子」という普通名詞が「100パーセントの」という語句によって修飾されている。村上春樹は、ある特殊な状況においては「女の子」を「100パーセントの」で修飾することが可能であることを知っている。では、その「ある特殊な状況」というのはどういった状況なのか。また「特殊でない状況」ではなぜこの修飾が成り立たなくなるのか。

 この問題、問題の所在がはっきりしていない。おそらく、問題の所在がはっきりと分かったときに、答えも同時に出てくることだろう。

*1:サポートベクターマシーンは尤度を測らないが、パターンの領域の真ん中に近いか周辺かということは測れる。