叡王戦設定のソフト対局

ソフトの長時間対局の棋譜が少ないなと思いデータを取り始めました。時間は叡王戦設定(持ち時間1時間秒読み60秒)にしました。PCは古い方のIvy Bridge (CPU1)、最近調子が悪いのですが、だましだましデータを取っています。一応各組合せ50局を目安にしていますが、一局約3時間かかるのでワンセット一週間くらいかかります。棋譜はこちらに置いています。追記:8/5 技巧 vs Silent Majorityが一応50局に到達しました! (1) 技巧 vs Silent Majority SSE4.2 最初の10局と次の40局は設定が以下のように違います。両方合計すると 技巧 25-3-22 Silent Majority 設定:最初の10局が Silent Majority 1.0 SSE4.2版, 4スレ, 定跡bookall, Bestbook move = off, Hash 1GB Gikou 4スレ Hash 1GB, 定跡on, Narrow book, Tiny bookはoff 持ち時間1時間、秒読み30秒 対局成績は5勝5敗 次の40局が持ち時間1時間、秒読み60秒 Silent Majority 1.1 SSE4.2版 Apery評価関数ver 1.2, 4スレ, 定跡bookall, Bestbook move = off, Hash 4GB Gikou 4スレ Hash 4GB, 定跡on, Narrow book, Tiny bookはoff 対局成績は20勝17敗3分でGikouがわずかに勝ち越し。 (2) ? vs ? 現在思案中。

レーティング表の更新について

今回の更新で前回、前々回のレーティング2000以下の表を技巧を深さ有限に制限したものを定規にしていくつかのソフトのレーティングを導入してみました。深さ有限というのは、あなたはX手先までしか読んではいけませんという制限で、技巧にX手先まで読んでもらってその中での最善手を指してもらい、それと対局するものです。技巧の「大局観」ならぬ評価関数と浅い探索を用いた設定で、アマチュアの方でもXが小さければ技巧に勝てるのではないかと考えています。 前回、前々回とは少しデータが違っています。それは有限深さの技巧の対局設定の問題で、これまでの設定(いずれにせよ1c0.1秒以上使わないので時間制限をそのようにしている)、だとどうも深さによるレーティングが凸凹しておかしいと思っていました。その後、たまたま、それでは4スレにして5秒設定にしたどう変わるか、とやってみたところ、かなり勝敗数が変わりました(1c-0.1秒では読み切れなかったのが与えられる手までは読み切れるようになった?)。その結果をグラフにすると以下の通り 深度1~3までは比較的凸凹していますが、一応直線であるように見えるようになり、これでレーティングを測ればよいのではないか、と考えることにしました。参考記録としてSunfish, Spear, Shogi686,Himawari mini, ssp, Lesserkaiなどといった今まで調べられなかったソフトのレーティングも(一秒対局ですが)含めることができました。なお、これらのソフトの対局条件は一手1秒であり、私のサイトでの標準である5秒対局にすればそれぞれ300程度のレーティング向上が

技巧を物差しとした下位ソフトのRating調査

(追記:7月15日 前日の記事と同様、こちらの記事も対局設定におかしい部分があったので、もう一度データを取り直しました。新しいデータは現在のレーティング表に掲載いたしました。) 昨日のブログで、思考深度を制限した技巧のレーティング調査について報告いたしました。なぜそのような調査を行ったかという目的の一つは技巧を適度に弱めることにより通常のアマチュア将棋ファンたちが普通に対局できるようなレベルに落とすことができれば、手加減アリとはいえ技巧先生と直接対局できるという点でした。もう一つの目標は思考深度1~9という10段階に平均的に散らばった仮想的なソフト群をアマチュアレベルの領域に導入することにより、この領域に存在している比較的少ないソフトたちのレーティングをソフト対局を用いて調査できるのではないかという希望があったからでした。技巧については最高に弱めたDepth1でもレーティング770というかなり高い数字になって、(このレートが果たして適切かという問題だけでなく、Lesserkaiなどのそこよりもレートが低いソフトを測ることができない、という問題もありました。そこで、今回はGikou depth1の下に実はいたBonanza 6 depth1を加えるとさらに下に位置するソフト群のレーティングも測れるのではないかということで、本日調査を進めました。結果的にはうまくいったようで、Sunfish2, SpearCSA09,shogi686, Sunflower mini, YaneuraOu nano, ssp, Lesserkaiなどといったこれまでどこに位置しているのかよくわからなか

読みの深さを制限した技巧のレーティング

追記:(7月15日)この記事のデータですが技巧の設定が少しおかしかったようで正しいレートが取れておらず、データを取り直しました。この記事で指摘しているレート差の凹凸の問題は新しいデータでは解決されています。詳しいことは7月14日の記事を参照ください。 技巧というというまでもなく現在手に入れられる最強のソフトで、通常は棋譜検討や研究に用いる、技巧をほかのソフトと対局させて鑑賞したりなど、ある意味で将棋の先生として使うことが多いと思います。一方で、有料ソフトの激指などに見られるように技巧を適当に弱くして日常的な対局相手にできないかという欲も出てきます。私もたまたまですが技巧を1スレ思考時間0.1秒に落としてみたところ、そのハンディにもかかわらずR2400前後のソフトより結構強かった(今のレーティングは2600近い)のは驚きでした。ただこれでもかなり強いので、さらに落として、様々なソフトのレートを測るものさしのような役割を果たせないかと思っていました。一つのソフトを基準にしてレートを測れば、私を悩ませる三すくみ現象からも解放され、ある程度頑張りさえすれば統計精度も上がっていくのではという希望も出てきます。ただ、思考時間をこれ以上削るとインターフェースがどれほど設定をちゃんと守るのかということがよくわからないので、さらに先に進むのは無理かと思っていました。 その後、ツィッターでDepthを制限する機能を教えてもらったのですがその後、mizarさんが技巧を修正して、設定した深さまで手を読む設定ができる技巧というものを発表されました。このソフトすごいと思って早速Depth1(一手しか読まな

強豪ソフトの引分け率と評価関数

5月28日のブログで書いた、将棋ソフトのレーティングが高いほど引分け率が高いのではないか、という議論ですが、一応レーティングと引分け率の表など出しはしたのですが、何かすっきりしない感じがずっと残っていました。その時の考察として(1)強豪ソフトほど入玉がうまくなるため256手ルールで引き分けになってしまうのではないか、と書いたのですが、その時のデータでは同じ引き分けでも、千日手と256手による持将棋を区別しておらず、入玉が上手になったから引き分けるようになったとは言えないのではないか、と思えてきた(2)同一ソフトの対局ほど引分け率が高く見えるので、ある程度強豪であればレーティングと直接相関なく、引き分けは増えるのではないか、という2点が問題点として残ってしまいました。その後、floodgateにおける引分け率についてこちらのサイトでも詳しい解析が行われ始めました。 その後、データをもう少し丁寧に見て、同じ引き分けでも千日手と持将棋を別々にカウントし、一局あたりの平均手数をカウントすることにしました。 その結果、というか注意深く対局成績を見ていれば当たり前だったのですが、(1)については増えているのは持将棋だけでなく千日手も同じように増えている、(2)については、技巧やnozomiの登場で引分け率が高まっているのは同一ソフトというより同じ評価関数を用いているソフト同士の対局の特徴ではないかということがはっきりしてきました。 現在のところ引分け率が顕著に高くなっている(4%以上)ソフトは、4スレ/8スレ, AVX2/SSE4.2の区別を忘れると、AperyWCSC25より上の10個の

アマR、プロRとの比較

6月23日のブログで試みて、様々なご意見をいただいたアマチュア段位(将棋倶楽部24のレーティング)とプロ棋士のレーティングとの比較ですが、私が行っているレーティング調査がそれなりに順調に進み、公開されているフリーソフトをほぼ網羅しましたので、改めてもう一度取り上げてみたいと思います。前回も申し上げましたが、このような比較はそもそも意味があるのか議論があることは重々承知しております。疑問点をはさむ余地はいろいろありますが(あとで述べます)、私が目標としているサイトなどにも段位表示があって、とても分かりやすい目安となっているので、私のサイトで出しているレートがアマチュア段位やプロレートとどう対応しているのかについて考察するのは私にとっては避けられない課題だということをご理解ください。 アマチュアレート、プロ棋士レート、私のサイトにおけるレートではすべてELOレーティングという考え方でレートをつけています。リンクしたWikipediaのページで詳しく解説されているとおり、200点のレート差がある指し手の間では高い方が約76%の確率で勝利するというもので、数式で書くと両者の勝率をp,qとするとレート差が400xLog(p/q)となるというものです。あとで、詳しく述べるソフトと人間のレーティングのつけ方の違いはあるのですが、思想としては同じなので、計算する基準点を決めれば数をずらすだけで比較が可能なものになっているはずです。ソフト間のレートの場合は多くの実験が可能で、自分が望むだけ正確に対応関係が分かるはずですが、ソフトと人間との対局で公開されているものは限られた数しかないのでものすごく

特集記事
最新記事
アーカイブ
タグから検索
まだタグはありません。
ソーシャルメディア
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square