ソフトの駒落ちハンデ

February 4, 2017

(2/5) この記事、書き足しているうちにわかりにくくなってしまったので書き直します。

 

アマチュアの将棋で棋力に差があるプレーヤ同士が対局する場合、駒落ちでハンデをつけるのが普通です。一方、プロやソフト同士では駒落ち戦はほとんど行われておらず、棋譜も少ないのが現状だと思います。この記事では現時点(2017年1月)で代表的なフリーソフトであるうかむ瀬(Apery SDT4)と技巧がどのような駒落ち戦を戦うのかを取り扱います。対局は評価値グラフがすぐ見れるのでShogiGUIを用いて行いました。また定跡はすべてオフにしています。定跡を用いると下手がより有利な条件から始められるのですが、強豪ソフトがどのような序盤を指すのかも一興ですのでまずは定跡無しでデータを取ることにしました。棋譜も資料的な価値があると思いますのでこちらに置きます。

 

ソフトと人間の対局の大きな違いは、ソフトは大きな失敗をしないという点があげられます。少なくともR3000以上のソフトである限り明らかな悪手をソフトは指しません。ただ、各局面でほんの少しだけ良い手を上位のソフトは指し続けるので、それが累積することにより最終的には大きな差を生むことになります。私がソフトの駒落ち戦を見ていて大変興味深かったのは、条件をうまく設定して下手と上手の勝率が拮抗するようにすると、下手に有利な評価値(例えば角落ちであれば800点あたり)を中終盤の80手辺りまでずっとキープすることがあげられます。ある程度、評価値の差がある局面では有利な方がより有効な手を指すことができるため、ソフト同士の対局の場合逆転が難しいのですが、ソフト間の力量差によりその有利さを相殺することが出来る結果、アンバランスな局面をずっと続けることが出来ているようです。人間同士の対局の場合は下手にどの程度悪手が出るかで勝敗が決まるような気がしますのでソフトのハンディ戦はその意味で随分違うと思います。

 

この調査の目的は、香落ち、角落ち、飛車落ち、2枚落ちでどの程度レートに差が現れるのか、今の最上位のソフト(浮かむ瀬、技巧)が駒落ちをしたときに釣り合うソフトはどのレベルかという点がまずあげられます。もう一つ調べた点として、同一ソフトでも持ち時間を減らすと弱くなるのである程度減らせば駒落ちしたのと同じくらいのハンデを与えられるのではないかという点です。実際、飛車落ちくらいまでは持ち時間の差で同一ソフトで上手と下手を釣り合わせられることが確かめられました。持ち時間の差はソフトが動いているハードの差でもあります。ハードの差は一秒あたりに読む局面数(NPSと呼ばれる)で測ることも出来ます。NPSはベンチマークコマンドを用いることにより測れます(以前2016/8/3ブログの記事にしました)。

 

(1)香落ち:駒落ちとは言うもののほとんど差はないという認識。

浮かむ瀬で自己対局。それぞれ一手五秒。

上手38-12-50 下手 (R差40)

想定通り差は誤差の範囲。ハンディとは名ばかりのものか。上手はほとんどの場合振り飛車にするのが印象的。

 

 

(2)角落ち:5段(級)くらいの棋力の差があるプレーヤで用いられるハンディだと理解しています。

 

浮かむ瀬:(R3695) 初期盤面の評価値は800前後。

コマを落としてGPSFish_minimal (R3032)と一手5秒で対局。

浮かむ瀬(角落ち)53-1-46 GPSFish_minimal (R差24)。これから推察できるレーティングはR3056

浮かむ瀬同士、上手一手5秒、下手一手1秒(上手は駒落ちハンデ、下手は時間ハンデで均衡させる)100局対局させると

上手 38-7-55 下手 (R差60)

 

技巧:(R3520) 初期盤面の評価値は600前後。GPSFish_minimalと対局。

上手 37-3-60 下手。(R差84) これから推測されるレートはR2948。

技巧同士の時間ハンデ対局として上手の持ち時間を一手11秒、下手一手1秒

上手38-9-53下手 (R差53) 

技巧の場合時間ハンデがうまく効いていない(?)


(3)飛車落ち:ソフトの場合角落ちとそれほど大きな差は出ない。

 

浮かむ瀬(飛車落ち)vs GPSFish (R2876) 上手 38-4-58 下手(レート差 -70) 下手

これから飛車落ち浮かむ瀬のレーティングはR2806と推察される。角落ちとのレート差はR250、平手とのレート差はR890となる。

時間ハンデで均衡させようとすると持ち時間10倍で

 

上手(持ち時間5秒) 58-5-43 下手 (持ち時間0.5秒) (R差74)

 

技巧(飛車落ち) vs Bonanza 6 (R2746)

上手 59-1-40 下手 (レート差59)  これから飛車落ち技巧のレーティングはR2815。

 

(4)二枚落ち

浮かむ瀬(2枚落ち) vs Bonanza 1.2 (R2122)

上手33-67 下手 (レート差-123) これから2枚落ち浮かむ瀬のレーティングはR1999

技巧(2枚落ち) vs Bonanza 1.2 (R2122)

上手56-44 下手 (レート差41) これから2枚落ち技巧のレーティングはR2163

ちなみにBonanza1は10年ほど前にその当時のハードで将棋倶楽部24に参戦しR2400(5段)という記録が残していますので、これらのソフトは2枚落ちでアマチュア高段者のレベルなのかもしれません。

 

以上の調査結果をまとめると駒落ちのレーティングは(対局が100局程度なのでR50程度の統計誤差)

 

 結論としては、香落ちでR40, 角落ちでR550-R650, 飛車落ちでR700-R900, 2枚落ちでR1400-R1700程度レートが下のソフトと均衡する。浮かむ瀬よりも技巧の方がレート落ちはやや少ないように見える。逆に時間差でハンデをつける場合は浮かむ瀬の方がより効率的、つまりより少ないハンデで均衡できるようだ。

 

蛇足だが、現在の最強ソフトのPonanzaはR4000と想定されているので角落ちでR3400, 飛車落ちでもR3100以上あるように思われる。実際のところどうなのだろうか、真面目に関心がある。

Please reload

特集記事

以前より、私のツィートや記事にコメントをいただいている、コンピュータ将棋に大変詳しい方(まふさんと名乗られています)が、技巧の定跡の開発を始められました。定跡を作るためのデータとして私がレーティング計測用に作った棋譜ファイルを使っていただいているという縁もあり、新定跡のテストを私が担当することになり...

技巧新定跡(まふ定跡)

December 8, 2016

1/10
Please reload

最新記事

September 30, 2018

Please reload

アーカイブ