「認識とパタン」。

 絶版のようであるが、図書館にはあったので紹介する。実に三十年前の本であるが、未だに議論に決着のついていないことばかりが書かれている。岩波新書である。本日の日記では、私が面白いと感じた部分を抜き出す。私の文章ではなく、引用した文章を中心に読んでいただければ幸いである。

 この本はパターン認識の本である。三十年前の本なので、今の研究者たちが忘れていそうな根本的な議論から始められている。

そういうわけで、パタンを見るということは、大体、何々を何々と見なすということに相当しているといってよいでしょう。

 パターン認識とはなんぞやという話である。著者は「見なす」という回答を示しているが、そう言いきってしまっていいのかどうかは分からない。

実際に、コンピューターによりパタン認識の仕事をやってみると、この仕事が実は二つの性質の違った作業であることがわかります。それは、実際にパタン認識の仕事をしなくても原理的にもわかることです。その一つの仕事は、類を新しく作ることであり、もう一つの仕事は、既成の類をコンピューターに教えることです。

 今の言葉でパターン認識といえば、入力サンプルをクラスに分類することをいうことが多いが、それだけではなくクラスそのものを作るという作業が必要だということで、やはり議論が分かれるところである。個人的にはそのとおりだと思う。

別の言葉でいえば、パタン認識の第一義は情報の圧縮にあるといってもよいでしょう。

 そう言いきってしまっていいのかはやはり分からない。三十年前の著作なのに、未だに決着のついていない話ばかりが書かれている。思えば、パターン認識は古代の哲学者たちの時代からの課題である。そう簡単に決着がつく問題ではないともいえる。

 本当は本日の日記では、きちんと解説をしようと思っていたのだが、解説させてくれるだけの隙がこの著作物にはない。というわけで、最後に少々長めの引用をして終わろうと思う。パターン認識の話ではあるが、科学一般についての話であると思って読んでも面白いと思う。

グルー色のエメラルド

有名な例ですが、グルー色のエメラルドという話をいたしましょう。これはネルソン・グッドマンという人が発明した例で面白いので有名です。二つのHを考え、H1は「全てのエメラルドは緑色である」と主張しH2は全てのエメラルドは紀元二十世紀の終わりまでは緑色で、紀元二十一世紀の初めから青色である」と主張するとします。またAとして「この石はエメラルドである」という事実を意味し、Dは「この石は緑色だ」ということだとします。そうすれば、数多くの手に入る実例(証拠)はH1からでもH2からでも導かれるので、H1とH2は全く同程度に証拠で確認されたことになりましょう。それにもかかわらず人はH1をH2より好むでありましょう。その好みは論理外のもの、証拠外のものに由来しているといわざるを得ません。

人はH1の書き方とH2の書き方を見て、H2は時間に依存する表現になっているのでそれがいけないのだというでしょう。そこでグッドマン先生はグルー(grueはgreenとblueの半分ずつとって作った語です)色という形容詞を導入して、その意味は、二十世紀以前は緑色で二十一世紀以後は青色であるということとします。それからブリーン(bleen)という形容詞を導入して、その意味は二十世紀以前は青色であり、二十一世紀以後は緑色であるということにします。そうすれば今度はH2のほうは「全てのエメラルドはグルーである」という時間に依存しない表現になり、H1のほうは「全てのエメラルドは二十世紀以前はグルーであり二十一世紀以後はブリーンである」という時間に依存する形になります。

グッドマンのいいたいのは、論理と証拠による確認という点からはH1とH2とは全く同格だということです。それでは、人間はなぜH1を「好む」かという説明になりますと、グッドマンと私とでは少し意見が違いますが、その「好み」は脱論理的、脱実証的であるということでは一致しています。

カルナップの確率観

以上は黒白論理の範囲でのことですが、話をもう少し実情に即させるためには確率の観念を導入しなければなりません。カルナップという偉い哲学者は、確率を帰納に結びつけて考えたのはよいのですが、彼は確率の本質について根本的な間違いを犯していたのです。彼はc(h,e)という関数を導入して、これは証拠eがあったときに仮説hの確率という意味で、我々の流儀で書けばp(H|D)というわけです。彼の確率観は「必然」主義というもので、英国のケーンズなどと同じく、A→Bという論理関係の如くp(B|A)という確率もAとBとから必然的に定まって個人的な意見などに無関係な客観的なものであるというのです。これが根本的な誤りのもとでした。帰納的推論の場合p(D|H)は仮説Hの定義から定まるでしょうが、その逆の条件付き確率p(H|D)はベイズの定理からp(H|D)∝p(D|H)p(H)となり、ここにp(H)は証拠Dに無関係なHの信頼度です。ここにはその仮説についての好き嫌いすなわち個人的な要素のはいる余地が充分あるのです。ですから、カルナップのいうp(H|D)=c(h,e)は客観的に定まっているなどというのは蒙説であると私は思うのです。

 引用は全て「認識とパタン」渡辺慧から。