講演会

http://minerva.cs.uec.ac.jp/~ito/entcog/contents/lecture/index.html
↑行ってきました。

開始直前には満席の感じでしたね。
やはり、ホットな話題ということなのでしょう。

モンテカルロ法は、断片的にWebで情報を集めてたんですが、今回、体系的に説明を聞くことができて、だいぶ頭の中がすっきりしました。
UCBの数式の意味もようやく理解できましたし。

互角の形勢のときだけ突然真剣勝負、差がついたら手を抜く。「大差で勝てる局面でも、そのまま勝ちにいかず、手を抜いて僅差で勝とうとする」という特性は初めて知りました。
playoutを行うにも、完全なランダムではダメ、かといって手を絞りすぎてもダメ、と、なかなか難しい。
playout自体を強くすれば全体として強くなる、ということでもないみたいですし(山下さんは強くなるはずと仰ってましたが)。
他にもいろいろ問題点があって、モンテカルロだから何でもうまくいくわけではない、というのはちょっと驚きです。
なにか理論的な根拠があって強いのではなくて、やってみたら強かった、という感じなんですかね。

55将棋での学習。自己対戦の棋譜から学習というのは、自分自身を教師にした教師あり学習?という感じでしょうか。
小学生の子供に、10年後のその子を家庭教師にして勉強を教える? …違いますか。
文系人間の私には、目的関数とか偏微分とかは「知らない世界」なのですが、学習と関係ない部分はとっても勉強になりました。ym将棋にも実装してみたい機能もありました。