駒落ちハンデ 第3回調査

(7月29日 2枚落ちのデータを追記) 最近の野良評価関数の出現でソフトのレーティングも急速に向上しています。あまりに進歩が速いので色々な面からチェックを入れてみようと思うようになりました。まずは駒落ちでどの程度のソフトと釣り合うかについて調べてみました。前回の調査ではWCSC27で登場したelmoと技巧2について調査を行い、角落ちについてはelmoが大樹の枝とほぼ互角(R3270程度)、飛車落ちについてはGPSFishよりやや上(R2912)あたりまで到達していました。今回はYaneuraou4.73とyaselmo (野生の読み太1.1とelmoを50:50で配合した評価関数)で同じような調査を行いました。この組み合わせのレーティングはこれまでの調査ではR4100前後でelmoよりもR130ほど強いと思われます。対局の結果は以下のようになりました。 yaselmo (YaneuraOu 4.73) R4098 yaselmo (角落ち) vs 技巧20160606 (R3520) 41-1-57 R差-57 R3463 yaselmo(飛車落ち) vs Apery_WCSC25 (R3157) 59-0-41 R差63 R3220 yaselmo(二枚落ち) vs Nanoha Nano (R2359) 56-0-44 R差41 R2400 前回のelmoを用いた調査と比べると 角落ちについては R3270 → R3463 (約200増) 飛車落ちについては R2902 → R3220 (約300増) 二枚落ちについては前々回の調査の技巧が最後で2枚落ちレートR21

野良評価関数のレーティング

野生の評価関数についてレート表に載せるべきかどうか、アンケートを実施したところレートを出したほうが良いというご意見が半数近くになりました。その一方で定跡を用いて育成した定跡について定跡をonにすべきかどうかなど、微妙な問題点が色々あるので慎重であるべきだ、というご意見もありました。 まずは、よせられた意見に一番簡単に対応する方法としてユーザーにより作られた評価関数に対して別表をここに作りそのうち全体の表にのせた方が良いと私が判断したものを全体の表に移動することに致します。レーティング計算の基準としてはelmo-wcsc27をR3960に設定してあります。 ユーザーによる評価関数は作成が簡単だということも手伝って多数出現しています。一つの評価関数のレートをある程度の精度で出そうとすると少なくとも数日は必要であり、私のところで全体を網羅することは不可能です。したがって、ネットなどでとくに評判になり自分のパソコンと電気代を使って調べたほうが良いかなと判断するものついては私が調べますが、それ以外の評価関数でぜひこの表に載せるべきだと思われるものがありましたら、下記の寄稿規定に従ってこのサイトのContactページから対局結果をお送りいただければ、統計処理などはこちらで行ってレートをこちらに載せることに致します。(対局結果、統計処理のスクリプトはこちらを参照してください。) 今のところ、私のところで測定されたWCSC27以降の代表的な評価関数, elmo, elmo-qhapaq, rezero8,これに今まで測定した野良評価関数(一般ユーザーが作った評価関数)野生の読み太1.1, re

持ち時間による勝率の変動

ソフトのレーティング計測でお世話になったtoshiさん(@snooze1mitsuya ‏)が持ち時間によって勝率がどのように変動するのか実験されました。他の方がやられたデータでブログを書くのも何なのですが、大変興味深いデータだと思いますので紹介させていただきます。 用いられたソフトはYaneuraou+野生の読み太v1.1 vs Yaneuraou+elmo-WCSC27で持ち時間はそれぞれ一手0.1秒、3秒、12秒になっています。toshiさんが使用されているPCのCPUはryzen 1700 (8スレッド)で一手3秒が私の環境での一手5秒に相当しています。 0.1秒 野生の読み太 234-2-173 elmo (R差52) 3秒 野生の読み太 222-13-174 elmo (R差41) 12秒 野生の読み太 212-6-191 elmo (R差17) それぞれ約400局ですので統計誤差は1σが約17、0.1秒と3秒の差はほぼ統計誤差の範囲内、12秒は2σ程度のレート差があります。0.1秒と12秒の差が思いの外少ないのが印象的です。elmo絞りをすると長時間で強くなる傾向があるようなのですが、野生の読み太評価関数もelmo絞りなので、持ち時間による変動があまりないということなのかもしれません。一般に短時間と長時間でどのように勝率が変動するのかについては別に調べたほうが良いと思っています。 その後、他の組み合わせも測定されています。 yaselmo vs elmo 3秒 yaselmo 528 - 48 - 224 elmo (R差138) 1秒 yaselmo 513 -

新たな評価関数のファミリー

前回の記事のあとから、凄まじい勢いで新しい評価関数が登場し始めました。プログラマでなくても、ある程度の将棋の知識とコンピュータリソースさえあれば、自分にカスタマイズされた評価関数ができるというのは大きなインパクトが有ったのだと思います。記事のあとも色々な出来事が有りました。 全自動評価関数作成スクリプト「Shivoray(シボレー)」の登場 ブレンド手法の一般化 後者については、私のサイトへのメールでyanetesという方からelmoとリゼロepoch8のブレンド(ブリード・キメラ化)が強いのではという示唆をいただき、少し調べてみたら実際結構強い、、そのむねツィートして一日もしないうちにやね氏によるより詳細なデータが登場し、大騒ぎになるという事態になりました。人間の将棋界は藤井くんの活躍で大きな盛り上がりをみせていますが、将棋ソフトの世界もそれに負けない大きな進展 -- ノンプログラマーによるソフト改良 -- により大きなブレークスルーが来るのかなと胸躍る感じです。もしかすると私のような級位者でもコンピュータの助けを借りて将棋の真理に近づけるのかもしれないという希望が出てきました。 私が知っている範囲で新たな評価関数の動きをまとめると(漏れているものがあるようでしたらお知らせください) まふさんによるまふ定跡を用いて育てた新たな評価関数 読み太評価関数をelmoしぼりして育成した野生の読み太 様々なブレンド評価関数(今のところ、elmo+rezero8 (relmo), 野生の読み太+elmo (yaselmo)の評判が良い) tibigameさんの振り飛車評価関数 くらいで

特集記事
最新記事
アーカイブ
タグから検索
まだタグはありません。
ソーシャルメディア
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square