レーティング表の更新について

今回の更新で前回、前々回のレーティング2000以下の表を技巧を深さ有限に制限したものを定規にしていくつかのソフトのレーティングを導入してみました。深さ有限というのは、あなたはX手先までしか読んではいけませんという制限で、技巧にX手先まで読んでもらってその中での最善手を指してもらい、それと対局するものです。技巧の「大局観」ならぬ評価関数と浅い探索を用いた設定で、アマチュアの方でもXが小さければ技巧に勝てるのではないかと考えています。

前回、前々回とは少しデータが違っています。それは有限深さの技巧の対局設定の問題で、これまでの設定(いずれにせよ1c0.1秒以上使わないので時間制限をそのようにしている)、だとどうも深さによるレーティングが凸凹しておかしいと思っていました。その後、たまたま、それでは4スレにして5秒設定にしたどう変わるか、とやってみたところ、かなり勝敗数が変わりました(1c-0.1秒では読み切れなかったのが与えられる手までは読み切れるようになった?)。その結果をグラフにすると以下の通り

深度1~3までは比較的凸凹していますが、一応直線であるように見えるようになり、これでレーティングを測ればよいのではないか、と考えることにしました。参考記録としてSunfish, Spear, Shogi686,Himawari mini, ssp, Lesserkaiなどといった今まで調べられなかったソフトのレーティングも(一秒対局ですが)含めることができました。なお、これらのソフトの対局条件は一手1秒であり、私のサイトでの標準である5秒対局にすればそれぞれ300程度のレーティング向上が予測できますので、正式なレコードではなく、あくまで参考記録として考えてください。あと、LesserKaiのレーティングが負になってしまったのは残念だったのですが(本当はR100~200位に来てもらいたかった)、勝敗数をベースにするレーティングではどうしても下の制限はなくなってしまいますので、適当に換算してお考えください。

現在のレーティング表は、R2000より上が、各ソフトによる対局結果をベースとしたレーティング、一方それ以下思考深度を制限した技巧を物差しとしたレーティングで上下でかなり意味が変わっています。その辺の矯正をどうするかが今後の課題です。また、当然ある疑問としてなぜ技巧を物差しにするか、という問題もあるのですが、今のところ思考深度有限という設定があるのは(私の理解では)

技巧とBonanzaだけで、Bonanzaは思考深度による変動が私のところでの実験では上のように一様でないという問題があります。各将棋エンジンには強さレベルの設定があり、それを用いる方法もあると思いますが今のところ未検証です。(何か情報がありましたらお知らせください)

興味を持っているのは、技巧の深度nがアマチュアレーティングのどの辺に位置するのか、ということです。Bonanza3は私のレーティング表ではR2200くらいですが、将棋倶楽部24ではR2600を出したというレコードもあります。ただし、これは2007年あたりで今は少し上がっているのではないかと思います。24レベルの早指しレベルで対応する技巧の深度7~8レベルがどのあたりに来るのか大変興味があります。

ちなみに深さ有限の技巧ですが、本家ではなくMizarさんが改良したバージョン

https://github.com/mizar/Gikou/releases/tag/v1.0.1b

を使っています。スレッド数=CPU数、思考時間=1秒以上の設定で、深さ9以下では人間的にはノータイムで手を指してくれます。24レートの初段が1500くらいですので、私の予想としては早指しで深度3~4あたりが初段のレベルだと予想しているのですがいかがでしょうか。(ちなみに私は深度1でも負けます)このブログをお読みの方で腕に自信がおありの方が挑戦して報告していただけると大変参考になります。ほとんど手は読まないけれども大局観だけで指してくる技巧と思ってもらえればよいと思います。

最後に、技巧のhyper thread(lazy smp)が本当に機能しているのかですが、前から確認したかったのですが、npsのレベルでは50%以上伸びているのですが勝率がそれに追いついていないようで以前より気にはなっているのですが、技巧以上に強いプログラムがない現状では(8スレ対4スレは熱処理の問題でやりたくない)、なかなか難しいかと思っていました。ここ数日技巧の思考自由度を縛る実験をしていたので、1秒対局である程度の評価ができると思い、やってみたのが以下の結果です。

対局数500で技巧8スレ247勝、4スレ174勝、レート差60, 千日手 41 持将棋 37

(棋譜が1つ壊れています)、設定は定跡on, Narrow book onで以前の対局では有意の差が出なかったのですが、一応レーティング表程度の差はあるように見えるので、技巧については8スレのレートもキープということにしたいと思います。tanuki-WCSC26についてはまだ自信が持てないので今後検証する予定です。

特集記事
最新記事
アーカイブ
タグから検索
まだタグはありません。
ソーシャルメディア
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square