アマR、プロRとの比較

July 1, 2016

6月23日のブログで試みて、様々なご意見をいただいたアマチュア段位(将棋倶楽部24のレーティング)とプロ棋士のレーティングとの比較ですが、私が行っているレーティング調査がそれなりに順調に進み、公開されているフリーソフトをほぼ網羅しましたので、改めてもう一度取り上げてみたいと思います。前回も申し上げましたが、このような比較はそもそも意味があるのか議論があることは重々承知しております。疑問点をはさむ余地はいろいろありますが(あとで述べます)、私が目標としているサイトなどにも段位表示があって、とても分かりやすい目安となっているので、私のサイトで出しているレートがアマチュア段位やプロレートとどう対応しているのかについて考察するのは私にとっては避けられない課題だということをご理解ください。

 

アマチュアレート、プロ棋士レート、私のサイトにおけるレートではすべてELOレーティングという考え方でレートをつけています。リンクしたWikipediaのページで詳しく解説されているとおり、200点のレート差がある指し手の間では高い方が約76%の確率で勝利するというもので、数式で書くと両者の勝率をp,qとするとレート差が400xLog(p/q)となるというものです。あとで、詳しく述べるソフトと人間のレーティングのつけ方の違いはあるのですが、思想としては同じなので、計算する基準点を決めれば数をずらすだけで比較が可能なものになっているはずです。ソフト間のレートの場合は多くの実験が可能で、自分が望むだけ正確に対応関係が分かるはずですが、ソフトと人間との対局で公開されているものは限られた数しかないのでものすごく大雑把な比較しかできませんが、私の今の見立てとしては、アマレート=(私のサイトのレート+250), プロレート=(私のサイトのレート-1200)くらいというもので、目印となるソフトでレートを比較すると以下のようになります。プロRとアマRのレート比較は性格がだいぶ違っているので注意が必要です。アマRは基本的に早指し対局であり、プロは参戦している方がいらっしゃるとしても所詮は遊びです。従って今あるソフトの24参戦記録が主要な情報源であり、プロとの比較は参考程度にしかならないと思っています。一方プロRは主に長時間対局をベースに計算されています。ソフト対局で比較できるものとしては、ソフト貸し出しがなかったころの対局、渡辺Bonanza戦と第2回電王戦あたりくらいしかないというのが正直なところです。

 

(#追記 この表ですが私が数か月にわたり調査したソフト対局調査を基にするものであり、私は著作権を主張いたします。勝手に余分なデータ、特に棋士の実名などを追加して煽情的な形で掲載されることについては心外であり強く反発いたします。掲示されたい場合はこのサイトの連絡先、あるいはツィッターなどを通じて許可を取っていただきたいと思います。あと、この表のレートはこの原稿が書かれた当時のものです。ソフト対局のデータの増加でレーティングンは多少変化します。)

 

目安となる基準はあまり多くないのですが、

 

(1)アマチュアレート

短時間対局ですので、ソフトRをある程度直接アマRと比較できると思っています。

2005年Bonanza1が24R2400, 2007年Bonanza3が24R2600,2008年渡辺Bonanza戦のBonanzaがBonanza4相当、ハードが私のPC(当時の8c, わたしのPCが4c)とほぼ同等で24R2800と考えられた。

2011年ころの奨励会トップと思われる人たちが24R2900-3200(読者の方からの面白すぎるメールから推察。下に添付), このあたりがBonanza6あたりかと推察。なお、10年前に比べると最高Rの更新が一時続いたようにレーティングのインフレが起こっています。それを考えるともう少し差分を足してもよいと思います。

2014年やねうら王が24に参戦。R3170位。このときのやねうら王は公開されていないのでよくわからないのですが、第三回電王戦(2014)に登場したやねうら王が当時の磯崎氏のインタビューからのうろ覚えでBonanza6+R50くらい。24に参戦したソフトはそれから改良した新やねうら王だったはずなのでさらに+R100でBonanza6+R150位と想定。Bonanza6のレートにR150加えるとおおよそそのような数字になるのでそれほど大きく間違ってないと思われる。

うんと離れますが将棋所に付属しているLesserKaiはハム将棋程度と理解していますが、このあたりが24に挑戦できる目安のR100~200と推察、偶然かもしれませんがあっているような気がする。

 

Bonkrasが2012年24でR3292、Ponanzaが2011年、2013年、2015年に参戦してそれぞれR3138, R3440, R3455を記録していますがPonanza2011以外は強すぎてレーティングが正しく測れているとは思えず、Ponanza2011はWCSC21に参戦して5位ですが公開しておらず、前後の順位だったBonanza, GPSshogiはクラスタ構成でレーティングがよく見えないのであまり参考になりません。

 

仮定を提案するときは否定する方法も与えないと意味がありません。この対応が正しいかどうかの判定ですが(4CPUで同じ持ち時間でコンピュータを動かした場合の比較です)、上の表でいうとssp, mssがR1200前後で24でのアマチュア4~5級、YaneuraOuNanoが初段、Shogi686が2段とSpearが3段、Bonanza1が5段、なのはminiが7段という見立てとなりますが、いかがでしょうか、もっともらしいでしょうか?(私はR500以下の低級なのでよくわからない) この辺のレートのソフトについては24有段者の方であれば実際に対局して検証できると思うので感想を聞かせていただけるとたいへん幸いに思います。

 

(2)プロレーティングとの比較

これは前回(6/23)でも試みて、渡辺Bonanza戦における渡辺竜王の感想(Bonanza=Bonanza4の棋力が奨励会初段~3段程度、棋士レーティングのサイトではR1554)からざっくり1000くらいの差かと書いたのですが、その後、Bonanza6のレートがR1700くらいになって上位棋士のグループに入り、いくら何でも強すぎるのではないかと考えました。個人名で大変恐縮ですが、千田5段(2016年7月現在)がApery WCSC25と50回くらい対局されていて勝率2割くらいだった、という某掲示板に書いてあった情報(その後、不屈の棋士・大川慎太郎著で確認できた)、などから200ずらしてみました。ただGPSshogi-三浦、Selene-永瀬(勝率1割程度)などの短時間対局、などを考えるとずらしすぎなのかもしれませんが、この辺はいずれにせよ短時間対局なのでどの程度重く見るべきかよくわかりません。

 

この対応を用いると、Bonanza6のレートがR1550くらいで奨励会のトップ、プロ棋士のグループでちょうど中位くらいとなります。第2回電王戦に参加での佐藤・Ponanza戦、船江・ツツカナ戦がいい勝負で、これらのソフトの長時間対局におけるレベルがBonanza6+αくらいのレートだと思うと、私の中では納得いきます。また、Seleneと永瀬先生が長時間ではほぼ互角であったというのは一つの良い目安だと思いますがSeleneのソフトRが公開されていないのでよくわからない、、

 

この議論はいろいろ難しいところがあり様々な問題を指摘することは可能だと思いますしかし、プロ棋士とソフト対局が禁じられている現時点では(1)双方が将棋の勝敗によるELOレーティングである(2)ある程度の対局数により計測されているデータである、という意味で、起点の変更の自由度はあるものの現時点では最も意味がある提案だと主張します。

 

このレートの対応についても直接検証することができます。まずBonanza6やGPSfishについてはこれらのソフトに対応すると思われる棋力の先生が多数おられるますので、少々小手試しをされればすぐにどの程度強いのかお分かりになるかと思います。ここに出ているソフトはすべてフリーですのでパソコンさえあればいつでも対局できます。私の議論の仮定やその根拠などについて結果ありきの果てしない論争を行うのがお好きであればいくらでもやっていただいていて結構なのですが、実は簡単な検証をおこなえば明らかにできる性質のものであり、私はそれだけが意味のあるものだと考えます。

 

最後になって恐縮ですが、以前いただいたメールで大変面白く、またこの記事を書く上で強い動機の一つとなったものを紹介させていただきます。個人名が多く、私が確認が取れるのはそれほど多くないのが問題なのですが、とにかく面白いしもっともらしくまた貴重な資料ですのでここにそのまま掲載させていただくことにします。

 

<ごん兵衛さんからのメール2016.6.13付>

人間のレーティングについて
ブログに人間とのレーティング比較の話題がありましたが、とても興味深い記事でした。 コンピュータソフトとレーティングのシステム自体詳しく知らないのですが、 
Bonanza1が2005年に叩き出した24R2400というレーティングは具体的に
どのくらいの棋力なんだろうと疑問に思います。 

2004年 あのプロ棋士ではないかと噂されたデクシが24R3003点に到達 
2005年 Bonanza1が24R2400、
ほぼ同レベルの激指がアマ竜王戦ベスト16 
(この頃は、腕に自身のある人にとってとても魅力的な相手であるデクシの存在や
ソフト指しされても強豪クラスにはほとんど影響ないレベルだったこともあり、
色々な強豪が24に参加していました。
天彦奨励会三段や糸谷奨励会、早咲アマ、吉田正和アマ名人が2700~2800、
菅井奨励会3級が2650、田中誠奨励会1級が2500、
山田朱美女流初段が2200くらいでした。
この頃、里見香奈小学生(女流2級)は2300くらいだったとの話。
当時24では有名なHAHAHAHAという人が2900でした。) 

2006年 激指が岩根女流初段に平手で勝利、激指・Bonanzaがアマ名人竜王に負け 
2007年 渡辺Bonanza戦、Bonanza3が2600、渡辺戦用で2800、YSS2744がアマ名人に負け 
2008年 激指がアマトップに3勝1敗。 
(この頃は永瀬奨励会三段が2900、豊島四段が2900~3100、瀬川四段が2700~3000、笠井女流アマ名人が2200くらいでした。里見女流三段も2700くらいとの話でした。24は所詮ゲームなので人間のレートの変動は結構激しいです。) 

2009年 激指が県代表に勝ち、GPSがアマトップに1勝1敗、YSSが元アマ竜王に負け 
2010年 あから対清水女流王将 
2011年 ボンクラーズ対米長永世棋聖 (米長永世棋聖はこの頃、24で2800くらいと発言。千田三段が2900~3200、福間三段2800~3100、早咲さんや今泉さんが2850くらいでした。デクシ時代に2900くらいだったHAHAHAHA氏は3130とかになっていました。HA氏は2005年頃にどう見てもプロレベルであり、そこから急激に強くなったとは思えません。) 

2012年 ボンクラーズR3292 
2013年 PonanzaR3409 (これ以降、ソフトはレートを吸い取る相手がいなくなっているように見えます。HA氏との差を見ると当時のデクシもそれに近い状態であったと推測します。最近では、塚田九段がR3150、山口アマ王将がR3000、西山奨励会は初段に上がった頃2800くらいとの話でした。) レーティングはすべて将棋倶楽部24の話です。

何かネタに使える話でもあればと思います。 新たな調査や考察を楽しみにしています。 

 

#このブログについては某関連掲示板を結果的に荒らしてしまったことについてたいへん反省しております。ただ、ここで書いていることについては、間違っていることがあるわけではありませんのでそのまま掲載しておくことにいたします。

Please reload

特集記事

以前より、私のツィートや記事にコメントをいただいている、コンピュータ将棋に大変詳しい方(まふさんと名乗られています)が、技巧の定跡の開発を始められました。定跡を作るためのデータとして私がレーティング計測用に作った棋譜ファイルを使っていただいているという縁もあり、新定跡のテストを私が担当することになり...

技巧新定跡(まふ定跡)

December 8, 2016

1/10
Please reload

最新記事

September 30, 2018

Please reload

アーカイブ