君と君らしくなさについて。
9月28日に「完璧な鳥」について、ポスターセッションで喋ってくる予定である。完璧な鳥がなんなのかということについては、「http://d.hatena.ne.jp/tihara/20060524#p1」と「http://d.hatena.ne.jp/tihara/20070714#p1」を読んでほしい。この話は、単なるブログ上の与太話として終わらせてもよかったのであるが、そのポスターセッションが「まだ始まっていない研究」を募集していたので題名と概要をメールに書いて「まだ始まる目処すら立っていませんが」と書き添えて応募したところ、発表してもよいことになったのである。後日、そのセッションのプログラムを見てみたら、私以外はとてもまともな題名だったので愕然とした。私の発表題目は「自動音声認識における尤度についての直観」である。見に来ていただけたら幸いである。NLP若手の会第2回シンポジウムである。
出力確率の話についてはその後もいろいろと考えたのであるが、行き着いた先は、「ペンギンは鳥らしくない鳥である」という有名なフレーズだった。結局は原点に戻ってくる。このフレーズをもう少し面白くするために「君らしくないね」というフレーズを採り上げることにする。
さて、本日の日記の本題である。ロボットに「君らしくないね」と言わせたいとする。このときロボットはニューラルネットあたりで「君」を認識し、その後、「君がいつもの君とは違っている」ということを認識するはずである。今のパターン認識の枠組みではそうなる。この最初に「君」を認識するとき「君」である出力確率は高いのだろうか、低いのだろうか。もちろん、ニューラルネットだから出力は確率ではないが、ログを辿ればぎりぎりの判定なのか、閾値からの余裕をもって「君」と判定されているのかは分かるはずである。もし、余裕の判定であったなら、「いつもの君とは違っている」ということを判定することはできるだろうか。おそらく、できない。もちろん、泥臭くプログラムすれば可能だろうが、エレガントに解くことは今のところできていないはずである。誰かがすでにこの問題を解いていたらごめんなさい(誰かが解いていたら教えてほしい。メールアドレスは左上のtiharaというところをクリックすると分かるようになっている。また、左下にメールフォームもある)。
おそらく、「君らしさ」と「君」というのはまるで別の概念なのではないかと私は考えている。そして、今のパターン識別は、「君らしさ」「あいつらしさ」「彼女らしさ」を比べることによって「君」と判断しているのである。どこかがねじれている気がしてならない。
一体、「君らしさ」と「君」はどういう関係にあるのが自然なのだろうか。
28日、追記。
そして、発表をしてきた。賛否両論ではあったが、かなりの人数の心を揺さぶるトピックではあったようだった。つまり、未提起の問題であるということである。今後、暇なときにゆっくりと考えていこうと思う。
ちなみに、予稿はこちらである。http://sslab.nuee.nagoya-u.ac.jp/yans/paper/ihara.pdfまた、この予稿を書くにあたり、次のような言葉で締めくくった。
今後の課題として,どのように工学的な研究を始めるかを考える必要がある.