JKishi18gouのレート推定

 現在、将棋倶楽部24に人造棋士18号(JKishi18gou)が常駐しています。このソフト、とても強くて、対局相手とのレートが離れており、いくら勝ってもほとんどレートが変化しない状態になっています。現在のレートはR3209ですが、もっと強いのではないかと想像されます。

 このような飛び抜けて強い存在がいた場合、レートのやり取りによる計算は無理があるので、ちょっと違う方法はないかなと考えてみました。イロレーティングではレートRのプレーヤとレートSのプレーヤが戦ったときレートRのプレーヤの勝率PがP=(1+10^(-(R-S)/400))^(-1)のように与えると定義されています。将棋倶楽部24の棋譜検索を使うと人造棋士が勝ったプレーヤのレートと負けたプレーヤのレートがわかるのでそれを用いて

F(R)=Product[p_i(R),i=1,..,W]Product[(1-p_i(R)),i=1,..,L]

という関数を定義します。ここでp_i=(1+10^(-(R-R_i)/400))^(-1) (R_iはプレーヤのレート)で最初のファクターが勝ったプレーヤに対する勝率、二番目のファクターは負けたプレーヤに対する負ける率をかけたものです。人造棋士のレートはこの関数F(R)が最大になる値として定義されると考えました。つまりF(R)の導関数F'(R)=0の解がJKishi18gouのレートとなります。この方法だとレートが離れたプレーヤとの勝敗の寄与も取り入れられるので18号のレートの定義としてはもっともらしいと思われます。(専門でないので間違えていたらコメントいただけると助かります。)

 計算してみた結果ですが、24から勝敗がダウンロードできる直近3600局のうち、(1) 相手がR2000以上、(2) 40手以上の対局、(3) 自動対局プログラム(カツ丼坊)の問題と思われる時間切れ負けを外すと残るのは890局。対局結果は883勝7敗。上記の考え方でELOレーティングを評価するとR3370。現在の24レートよりは高いですが、思ったよりは低めの値となりました。R2600台のプレーヤに取りこぼしているのが効いていると思われます。

 一方、3月になってソフトを動かすPCが変更になってより強くなったらしいので、3月の対局のみ考えると372勝1敗。レートを計算するとR3600となりました。一度しか負けてないので誤差を真面目に計算し始めると大変なことになりそうですが、個人的にはソフトレートからしてこれくらいあってしかるべき値だと思っています。

#加筆訂正

その後、18号が負けた7局のうち4局の対局相手はソフト指しとして将棋倶楽部24から登録抹消されていることがわかりました。その分を差し引くと18号のレートはR3370からR3530に上昇します。なお、残る3敗のうち1局は対ソフトです。

特集記事
最新記事
アーカイブ
タグから検索
まだタグはありません。
ソーシャルメディア
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square