モンテカルロ5五将棋の試み、その3。

 昨日は電王戦でしたね。ということで、細々と続けている私のモンテカルロ法の試みの中間報告でもここに書こうと思います。詳しいことは過去のエントリを「モンテカルロ」でブログ内検索して読んでください。このシリーズはどうぶつしょうぎから始めたのですが、その最初のエントリはこれです。

 さて、まだ本将棋に至っておらず、相変わらず5五将棋なのですが、棋譜がそこそこまともになってきつつあります。前回ベンチマークと同様に、駒割りのみの単純なmin-max4手読みを後手にして、先手を私のモンテカルロ試行数10000試行/局面で対戦してみたところ、先手の85勝15敗でした。前回が28勝22敗だったので、結構な性能向上です。

 何を改善したかということですが、本質的なことはほとんどどうぶつしょうぎの頃と変わっておらず、特徴量を変えてみたり、パラメータの数値をちょっと変えてみたりしただけです。ただし、一行だけ本質的な改善をしています。その一行は何かというと、局面評価関数にわずかな割合で乱数を混ぜたということです。なぜそれが本質的なのかということは面倒なので説明しません。

 そこそこのまともさなので、来年の秋くらいのUEC5五杯に出てみたくなりました。一勝くらいはできるんじゃないでしょうか。でも、私はGUIが作れません。将棋所の使い方(USIの使い方)も分かりません。CUIならなんとかいけますが、体力がないので会場で操作をし続けることができません。というわけで、結局出ることはないでしょう。そのうちソースを公開すると思います。

 ところで、私のソフトの最大の特徴はモンテカルロがどうのこうのということではなく、棋譜なしで学習しているところだと思います。学習の仕方は過去の記事に書きました。予想するに、やはりモンテカルロではなくmin-maxの方が強いと思います。でも、学習法は私がやっているような感じの方がコンピュータらしい手が出るんじゃないかと思っています。

 以下、棋譜の一例。棋譜はご自由にお使いください(使う人はいないと思いますが)。

続きを読む