AobaZeroのレーティング測定

しばらく前より、AobaZeroの成長の度合いを定点観測していますので、記事としてまとめていこうと思います。この記事はその性格上定期的に更新する予定です。 AobaZeroはAlphaZeroの追試を目標としているプロジェクトで山下さんのホームページよりソフトをダウンロードし、棋譜生成をお手伝いすることができるようになっています。そのページには自己対局によるレーティング、floodgateによるレーティングなどで評価関数がどのように成長しているのか、確認することができるようになっていますが、floodgateは滞在しているプログラムによる影響や対局数が稼げないことなど問題点もあるので、私のレーティング表における位置づけを当面適当な間隔で測ってみることにしました。 対局データ:対局相手としてはレーティングが測定済みの技巧2を採用しています。思考深度を調整してAobaZeroの棋力と合わせています。AobaZeroはプレイアウト800で測定しています。詳しいオプションは bin\aobaz -q -p 800 -w weight_save\w000000000XXX.txt (XXXにweightが入る)AobaZeroは乱数を入れないと同じ指し手しか指さないので、tanuki-互角局面集で24手間で局面を進めてからの対局させています。 この表の見方ですがVerはAobaZeroのバージョン、weightはネットワークのバージョン、AobaZero勝はAobaZeroが勝った数、技巧2勝は技巧2が勝った数、R差はレート差。Depthは技巧2の思考深度、技巧Rは対応する技巧2のソフト

測定ノード数とレート差(その2)

前回の記事ではDolphin1+水匠改とYO485+Kristallweizenの自己対局を用いてノード数により対局結果(ソフト間のレート差)がどのように変化するのか測定を行い、ノード数によりレート差が思いの外大きく変動することを示しました。今回の記事ではその際課題として上げていた、 ノード数を更に上げるとレーティング差は収束していくのか、 別のソフトの組み合わせで計測すると振舞いがどう変わるのか について、データを追加して考察していこうと思います。 対局条件としては前回からの継続で以下のようにしました。 一手あたりのノード数を固定する。tanuki-互角局面集を用いて25手目より開始。通常のレーティング測定方は初手から定跡切ですが、互角局面集を用いるとどう変化するか興味があるので採用。 320手で引き分け。-3000点で投了。 各ノード数で1000局(ノードが多い場合は500局)ずつ対局しレート差を計算。 今回はノード数は2,000から10,000,000の間で観測しました。両端ではおおよそR2500程棋力が離れています。ノード数1000万はレーティングサイトにおける測定条件に近い(一手1200万程度)ものです。将棋の検討で用いるノード数は一億を超えるので、できれば更に多いノードでの測定も行いたいのですが、ノード数1000万、500局で手持ちのPC(8スレ)で2~3日かかりますので、よほど高スペックのPCを用意しない限りこれ以上の測定は難しいと思われます。 [1] Dolphin1+水匠改 vs YO485+Kristallweizen こちらは前回の測定の継続です。前回はノ

測定ノード数とレート差

測定ノード数によりレーティングがどのように変わるのかは以前より多くの議論がなされています。例えば最近の磯崎氏の議論は、こちら(1)(2)を参照してください。 最近、水匠開発者の@tayayan_tsが新しい評価関数水匠改を公表されたのを機に、データを取ってみることにしました。お相手はYaneuraou 4.85とKristalweizen評価関数を組み合わせたもの、水匠は添付されているDolphin1と組み合わせました。その他の対局条件としては 一手あたりのノード数を固定する tanuki-互角局面集を用いて25手目より開始。通常のレーティングの測り方は初手から定跡切ですが、互角局面集を用いるとどう変化するか興味があるので採用。 320手で引き分け。-3000点で投了。 各ノード数で1000局ずつ対局しレート差を計算。 以前よりある程度知られていることでしたが、ノード差によりこの2つのソフトの相対的な強さは大きく変動することがわかりました。以下、対局結果とグラフを示します。まず対局結果は、 Dlp1/Suisho-Kaiの列はDolphin1+水匠改の勝数、Yo485/KwはYaneuraou4.85+Kristallweizenの勝数です。ノード数10,000というとかなり少ない感じですが、レーティングではR2000位、ノード数100,000だとR2700位なので将棋としてはそれなりのレベルを保った対局であり、将棋神やねうら王でもこれらのレンジのノード数は用いられています。測定を行った一手あたり2,000-500,000の範囲では水匠が勝ち越していますが、レート差はノード数に

特集記事
最新記事
アーカイブ
タグから検索
まだタグはありません。
ソーシャルメディア
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square