モンテカルロ木探索に関する雑感。

 先日電気通信大学でコンピュータ将棋とコンピュータ囲碁の講演会が開かれ、その資料がウェブ公開されている(私も行こうと思っていたのだが体調不良で行けなかった)。とりわけ、コンピュータ囲碁モンテカルロ木探索についてのPDFが非常に分かりやすい。

 モンテカルロ木探索というのは、大雑把に言ってしまえば、終局までランダムに石を打っていって勝率のよかった手を選んでしまおうというものである。細かい話については上記PDFが本当に分かりやすいので、それを読んでほしい。ランダムに石を打っていく時点では原始的なモンテカルロ囲碁ではゲーム木による探索をおこなわない。それでも、それなりにそれらしい手を打ってくれるようである。ここで当然の疑問が出てくる。なぜ、それらしい手が打てるのか。

 いろいろと考えたのだが、ポイントはいくつかあると思う。すでに研究会などで出尽くした議論ではあると思うが、書いてしまう。

 まず、囲碁の場合、ランダムに石を打ってもほとんどの場合自分にとってプラスに働くということ。一線に打ったらほぼマイナスだが、それ以外ならば0かプラスにはなるだろう。そして、どこに打っても、どれくらいのプラスであるかという振れ幅は小さい。ランダムに打つので、白も黒も双方同じくらいのプラスを重ねて終局を迎えることになるはずだ。

 次に、9路盤囲碁においても19路盤においても、離れた石の関連性が希薄であるということが挙げられるのではないかと思う。隅の攻防が盤面全体に波及していくということはあるだろうが、コンピュータ囲碁のレベルでは右下隅と右上隅を分離して読むこともできそうだ。これは、読みの手順が前後してもあまり問題にならないということと関係があると思う。また、隅の攻防が盤面全体に波及していく場合でも、「次の一手」さえ間違えなければその後の読みが杜撰でも問題ない。

 さらに、モンテカルロ囲碁のランダムな終局図というのは、人間の大局観に通じるものがあるのではないかと思える。自分の石のあるところにはランダムに石を置いていっても地ができる確率が高いだろうし、死活が微妙なときにはどちらに傾くか分からないし、何も打たれていないときにはそこは地としては単なるプラスマイナスゼロのランダムノイズとなる(19路盤ではこのランダムノイズの悪影響がかなり大きそうだが)。そういう意味で、大局観の再現にある程度成功しているのではないかと思う。

 私は囲碁も(将棋も)弱く、また、コンピュータ囲碁は全く作ったことがないが、そういうふうに思っている。

 そして、モンテカルロ将棋の話に移るが、現在様々な方々が試行錯誤しているようである。どこかで見た棋譜では(どこで見たかは忘れたがウェブ上のもの。yowai_gpsが相手だったような気がする)、素人から見るとかなりまともに指しているように思えた。とはいえ、私にはなぜまともに指せるのかがよく分からない。モンテカルロ囲碁囲碁だからこそ成功しているように思えるからだ。どこかで見たそのモンテカルロ将棋の棋譜では、おそらく、差し手に確率的な重みづけをしているのだろうと思うが、それならば既存の探索手法の方が強い気がする。

 個人的にはモンテカルロ囲碁からヒントを得た何かが将棋でも活躍したら面白いと思うのだけれど、一方で、そう簡単にはできそうにないなと感じている。

 ところで、ここ半年間くらいコンピュータ将棋に注目していたが、ようやく奥深さと難しさが分かってきたところである。苦戦している。