AobaZeroのレーティング測定

しばらく前より、AobaZeroの成長の度合いを定点観測していますので、記事としてまとめていこうと思います。この記事はその性格上定期的に更新する予定です。

AobaZeroはAlphaZeroの追試を目標としているプロジェクトで山下さんのホームページよりソフトをダウンロードし、棋譜生成をお手伝いすることができるようになっています。そのページには自己対局によるレーティング、floodgateによるレーティングなどで評価関数がどのように成長しているのか、確認することができるようになっていますが、floodgateは滞在しているプログラムによる影響や対局数が稼げないことなど問題点もあるので、私のレーティング表における位置づけを当面適当な間隔で測ってみることにしました。

対局データ:対局相手としてはレーティングが測定済みの技巧2を採用しています。思考深度を調整してAobaZeroの棋力と合わせています。AobaZeroはプレイアウト800で測定しています。詳しいオプションは

bin\aobaz -q -p 800 -w weight_save\w000000000XXX.txt

(XXXにweightが入る)AobaZeroは乱数を入れないと同じ指し手しか指さないので、tanuki-互角局面集で24手間で局面を進めてからの対局させています。

この表の見方ですがVerはAobaZeroのバージョン、weightはネットワークのバージョン、AobaZero勝はAobaZeroが勝った数、技巧2勝は技巧2が勝った数、R差はレート差。Depthは技巧2の思考深度、技巧Rは対応する技巧2のソフトレート、最後のRatingが各バージョンのAobaZeroのレーティングとなります。レーティングの値を縦軸、weightを横軸にしたグラフは以下のとおりです。

特集記事
最新記事
アーカイブ
タグから検索
まだタグはありません。
ソーシャルメディア
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square