自己対局平均手数からレートを推察できるか?

April 11, 2017

4月1日に行われたPonanzaと佐藤天彦名人の電王戦対局、Ponanzaの強さを見せつける対局となりました。その後、佐藤慎一氏が観戦記を書かれ、対局の見どころについて詳しい記事にされています。私の中で印象に残ったのは、Ponanzaが初手22通りの指手からランダムに選び、棋士側の研究対策をしていた点で、いわゆる嵌め手順に陥いることを防止する大変スマートな方法だなと感心させられました。また、Ponanzaの手順の巧みさなどについて詳しい解説をされていて、将棋ファンにとって見逃せない良記事でした。

 

個人的に、注目した点としては、最後の方に書いてあったPonanzaの自己対局の平均手数が200手近いという記述です。以前よりソフトの棋力が高ければ高いほど自己対局の手数が伸びる現象があるという傾向についてはこのブログの中でも注目していました。例えば次の記事()ではソフトの棋力が高いほど引分け率が高まることに注目していましたが、より詳しく調べると同一評価関数を用いているソフト同士の対局でそのような現象が顕著に表れることを見ました。ちなみにソフト同士の対局では完全に詰むまでやるので人間の対局(プロ同士で平均120手?)に比べると一般に長手数になります。

 

Ponanza(第4回将棋電王トーナメント版)のレートがどれくらいなのかは大まかな目安はあるものの(R4000~R4200?) 正確な情報は表に出てきません。平均手数が長いほどレートが高いという現象がどの程度もっともらしいのか、それからPonanzaのレートが推定できるのか、調べてみようと思います。

 

まずは短時間(一手0.5秒)の結果から。対局はそれぞれ4スレッドです。サンプルしたデータは下記のとおりです。

 

Gikou(R3523) 236-51-213 R差 16 平均手数 166

Silent Majority 1.24 (R3700) gcc版 169-13-133 通常版 R差40 平均手数 164 

Apery_twig (R3250) bmi2版 257-36-207 sse4.2版 R差35 平均手数 151 

OkaraManju_Jul2016 (R2885) 225-50-225  平均手数 144

ssp (R1166) 145-14-124 R差 25 平均手数 132 (一手一秒)

 

最後のsspは一手0.5秒に設定できないため一手一秒の対局です。見て取れる特徴としては

(1)確かにRが上がるほど手数が伸びているが、R800くらい異なるOkaraManjuとSilent Majorityの比較でも20手程度しか変わらないことからわかるようにそれほど伸びは顕著ではない。おおよそR500に対して手数が10手ほど伸びる位か。

(2)技巧とSilent Majorityの比較でもわかるようにレートが多少低くても平均手数が長いプログラムはある。技巧は入玉が上手なので自己対局では手数が伸びているように思われます。

(3)sspのデータから分かるようにレートが低くても平均手数はそれほど低くならない。強いソフトと弱いソフトを対局させると平均手数が80という例もありますが、自己対局の場合はお互いに弱いため決め手にかけ手数は思ったように短くならないようです。

(4)完全に同じソフト同士を対局させてもあまり面白くないためSilent Majorityでは通常版と自分でソースからコンパイルしたgcc版、Apery_twigではbmi2版とsse4.2版の対局にしてみました。それぞれわずかながらgcc版、bmi2版が強いということがわかりました。bmi2版はCPUのAVX2機能を活用するためsse4.2版より単位時間あたりに読む手数(NPS)が多く強いことはもとから予想されていました。しかし差はR35程度でそれほど大きくありません。一方Silent Majorityのgcc版がわずかながら強いというのはちょっとした発見だったと思います。

 

次に、一手にかける時間を5秒にした実験も行いました。読む時間が10倍になるのでレート換算するとR500ほど強くなっているはずです。また、このテストでは入玉宣言勝ちに対応しているSilent Majority 1.24と技巧を用いて、持将棋が成立するための手数を512手に伸ばしています(通常は256手)。これらのソフトでは自己対局では持将棋率が極端に高いため何手くらいで決着をつけているのかも興味の対象です。実験結果としては

 

技巧 (R3523) 97-11-92 R差8 平均手数 185

入玉宣言勝ち 15局 平均325手 256手終局にした場合平均 180手

Silent Majority 1.24 (R3700)  gcc版96-13-91 ebifrier版 R差8 平均手数174 

入玉宣言勝ち14局 平均296手 256手終局にした場合平均171手

 

持ち時間が伸びてレートが高くなったため平均手数は伸びていることがわかります。技巧で16手、SMで10手というところでしょうか。入玉宣言勝ちのパターンを見るとSilent Majorityでは428 340 326 300 296 296 284 282 280 279 272 266 260 241となり14局中256手で収まったのが1局。300手以内が9局となりました。256手以内で入玉宣言勝ちができるたのは一局だけで256手で打ち切る現行のルールでは入玉宣言勝ちに対応するメリットがあまりないことがはっきり出ています。SMでは300手くらいで切ることにより殆どの入玉宣言勝ちに対応できますが、技巧ではだいぶ様子が違っています。技巧は入玉宣言勝ちをするのに手数をかけているようで300手以内に宣言勝ちをするのは15局中5局のみです。これが平均手数をやや多めに伸ばす原因になっていると思われます。

 

以上の結果から結論を出すのはやや強引ですが

(A)長時間対局による手数の伸びからわかるように、レートが高いほど手数が伸びるのは事実のようだ。ただ具体的に評価するとR500の差で10-16で幅がある。一手5秒の技巧の平均手数を根拠にするとPonanzaとはR700程度以上の差があるように見える。これはレートにしR4100位になり、ある程度想定と一致している。ただPonanzaの平均手数が200手といったときにどのような条件で行っているのかがはっきりしていないのでその分は不定だと思います。

(B)レートの違いと平均手数は下限の存在が示すとおり、必ずしも一次関数ではないようだ。また、ソフトによる個性も大きい。

こんなもんでしょうか。

Please reload

特集記事

以前より、私のツィートや記事にコメントをいただいている、コンピュータ将棋に大変詳しい方(まふさんと名乗られています)が、技巧の定跡の開発を始められました。定跡を作るためのデータとして私がレーティング計測用に作った棋譜ファイルを使っていただいているという縁もあり、新定跡のテストを私が担当することになり...

技巧新定跡(まふ定跡)

December 8, 2016

1/10
Please reload

最新記事

September 30, 2018

Please reload

アーカイブ