AobaZeroのレーティング測定

June 14, 2019

しばらく前より、AobaZeroの成長の度合いを定点観測していますので、記事としてまとめていこうと思います。この記事はその性格上定期的に更新する予定です。

 

AobaZeroはAlphaZeroの追試を目標としているプロジェクトで山下さんのホームページよりソフトをダウンロードし、棋譜生成をお手伝いすることができるようになっています。そのページには自己対局によるレーティング、floodgateによるレーティングなどで評価関数がどのように成長しているのか、確認することができるようになっていますが、floodgateは滞在しているプログラムによる影響や対局数が稼げないことなど問題点もあるので、私のレーティング表における位置づけを当面適当な間隔で測ってみることにしました。

 

 

対局データ:対局相手としてはレーティングが測定済みの技巧2を採用しています。思考深度を調整してAobaZeroの棋力と合わせています。AobaZeroはプレイアウト800で測定しています。詳しいオプションは

bin\aobaz -q -p 800 -w weight_save\w000000000XXX.txt

(XXXにweightが入る)AobaZeroは乱数を入れないと同じ指し手しか指さないので、tanuki-互角局面集で24手間で局面を進めてからの対局させています。

 

 

 

 

この表の見方ですがVerはAobaZeroのバージョン、weightはネットワークのバージョン、AobaZero勝はAobaZeroが勝った数、技巧2勝は技巧2が勝った数、R差はレート差。Depthは技巧2の思考深度、技巧Rは対応する技巧2のソフトレート、最後のRatingが各バージョンのAobaZeroのレーティングとなります。レーティングの値を縦軸、weightを横軸にしたグラフは以下のとおりです。

 

 

 

Please reload

特集記事

以前より、私のツィートや記事にコメントをいただいている、コンピュータ将棋に大変詳しい方(まふさんと名乗られています)が、技巧の定跡の開発を始められました。定跡を作るためのデータとして私がレーティング計測用に作った棋譜ファイルを使っていただいているという縁もあり、新定跡のテストを私が担当することになり...

技巧新定跡(まふ定跡)

December 8, 2016

1/10
Please reload

最新記事

September 30, 2018

Please reload

アーカイブ