モンテカルロ将棋

少し実験してみましたが、なかなか難しいことを実感しました。
「細く長い手順」を読むのが難しい、とは聞いていましたが、実際にやってみて痛感。
駒の取り合いなんかはうまく読めずに、タダ捨てを繰り返したり、ということになります。
こういうのは、相手が取り返さないことを期待しているんですね。相手が取り返す手を指せば勝率はがくんと下がるのに、それ以外の手だと勝率がいいので、平均するとそこそこの勝率になってしまう。。

UCTを導入してみても、こういう状態を解消するにはプレイアウト数を相当増やさないといけない印象で、そうなると、処理が遅いym将棋では、現実的な時間内に処理が終わらない…
なかなか悩ましいところですが、あとはprogressive wideningを試すか、アルゴリズムを変えてみる、くらいしか思いつきません。