レーティングから見る将棋ソフトの劇的進歩について

September 7, 2018

ツイッターなどで、ここ数年の将棋ソフトの急激な進歩について把握されていない方が多いという印象を持ちました。Aperyが公表された2015年以前までの将棋ソフトの進歩は緩やかで、数年かけて人間のレベルを追い越していき現在に至っている印象があります。しかし、人間のレベルを超しプロ棋士との対局が下火になっていった2016年あたりから将棋ソフトは急激に強くなっています。せっかくレーティングを調べてきましたので、フリーソフトのレートがどのように伸びてきたのか、まとめてみたいと思います。

 

まず、次の表を御覧ください。(ソフトレートと24Rは2018.09.07のもの)

 

 

表の最初のフリーソフトとしてはBonanza1を取り上げました。Bonanzaのソースコード公開が将棋ソフトの発展の基礎になったという認識です。24Rというのはソフトレートを将棋倶楽部24のレーティングに換算したもので、最近カツ丼将棋の松本さんの協力のもと行った調査に基づき得られたものです。YOと書いたのはやねうら王エンジン。2014年くらいまでのソフトのレート進歩は緩やかですが、2009年に渡辺竜王(当時)と対局されたBonanza3 (マルチコアで実装された発展版=Bonanza4と同等とみなしてます)は、渡辺竜王をギリギリまで追い詰め、奨励会初段~三段の力量だと評されました。この当時のソフトの力量は24レートで2800前後、将棋倶楽部24の七段相当と考えられます。

 

将棋ソフトが最も注目された時期は将棋電王戦が行われていた時期だと思います。電王戦の経過についてはwikipediaがよくまとまっています。第一回電王戦(2012)で米長永世棋聖と対局したBonkrasはBonanza5をクラスタ化したものでした。レーティングは将棋倶楽部24に残っていてR3200~R3300。このあたりで人間の限界を超えました。第二回電王戦(2013)に登場し三浦八段と対局したGPSshogiは上の表に載っているGPSfishの前身で、600台のクラスタを組んで対局、ソフトレートでR3300、24RでR3500くらいあったと想像します。コンピュータがクラスタを組んでしまうと人類はもう勝てないのが歴然としました。

 

第三回電王戦(2014)からはコンピュータ側は普通のデスクトップPCにハードを制限する形で行われ、ソフトの思考スピードを抑えることにより、電王戦ファイナル(2015)までは、ほぼ互角の成績になりました。この当時のソフト(例えば公表されているApery_sdt3)の24換算レートはR3250程度、このあたりが斉藤五段(当時)など若手の元気な棋士のレベルではないでしょうか。その後、ソフトがさらに強くなり、第一期電王戦(2016), 第二期電王戦(2017)に出場したPonanzaは名人を含むプロ棋士を圧倒。このあたりからソフトがどれくらい強いのかわからなくなり、それにともない人々の関心も低くなっていきました。

 

このブログで強調したいのは、ソフトの強さが見えなくなった2016年以降の話です。実はこの間、将棋ソフトは劇的に強くなっていたのです。2016年の3月ころ、一番強かったフリーソフトはAperyでR3250 (24R 3450), それから2年半経過した現在最も強いソフトはR4300 (24R 4500)でレートにして1000, 段位にすると五段くらいあげています。この急激な上昇をグラフにすると次のようになります。

 

 

2005年から2015年まで10年のレートの進歩が約1000, その10年で24の五段くらいからプロ棋士のトップレベルに登りつめました。驚くべきなのはその後の2~3年で更にレートが1000伸びている点です。人間のトップからさらにレート1000くらい強いというのはなかなか想像しづらいのですが、それが顕著な形で出ているのが最近発売された将棋神やねうら王だと思います。このソフトはプリセットで対局する強さを選べるようになっています(段位設定では私もお手伝いしました)。その中で最も強い将棋倶楽部24の九段設定(R3200) ですが、コンピュータ側の思考時間は標準的なデスクトップPCで約0.1秒になっています。たった0.1秒の思考で人類トップレベルの実力になるのです。

 

レート差が1000といってもなかなかピンとこないかもしれません。レーティングは勝率と関連付けられています。レートが1000違うプレーヤー間で対局したとき勝率はどうなるか計算すると強いほうが勝つ確率が99.7%。100局対局したとしても弱いほうが勝てる可能性は1局あるかないかとなります。長い将棋の歴史でこれほど強いプレーヤーが現れたことはありません。しかも、将棋ソフトは無料で手に入るのです。

 

最近のソフト、あまりにも強いので対局相手に使うよりはプロ棋士の棋譜鑑賞や検討に使う方が多いと思います。その際、ソフトを何分も思考させて最善手や形勢判断をされている方が多いのではないでしょうか。注意していただきたいのは、その間ソフトは数億局面くらいは簡単に読んでしまいますが、その際の棋力はベラボーなものです。例えば、5億ノード読ませたとき(私のパソコンで2分位)のソフトの棋力は、単純計算すると24R 5400, 二十段相当まで上がります。このレベルでの読み筋は人間とはだいぶ違っていて、真似しようと思っても難しいと思います。ソフトが勝勢だと判断していても、それはその局面からソフト同士で指し継いだ場合に勝勢であるということ。レートが1000違うプレーヤの判断ですので、弱いプレーヤ間の対局では簡単に逆転が起こりえます。ソフトの評価値はこの意味では慎重に利用したほうが良い時代になりました。

 

しかし、棋力が高いことは悪いことではありません。正しく使えば人間の役に立ちます。科学技術計算などではコンピュータの計算力は圧倒的で人間が手計算することはほとんどなくなりました。ただコンピュータは新しい着想は生まないので、コンピュータに何を計算をさせるか考えて科学技術を進歩させているのは人間です。将棋も同じような時代に入ってきたと考えればよいと思います。ソフトを用いた序盤戦術の研究などは良い例で、人間のアイディアとソフトの棋力を有機的に結び付けて、新しい戦法が次々と生まれています。ソフトの棋力を理解したうえで有効活用する道を探すことは今後の棋理発展のカギになるのだと思います。

Please reload

特集記事

以前より、私のツィートや記事にコメントをいただいている、コンピュータ将棋に大変詳しい方(まふさんと名乗られています)が、技巧の定跡の開発を始められました。定跡を作るためのデータとして私がレーティング計測用に作った棋譜ファイルを使っていただいているという縁もあり、新定跡のテストを私が担当することになり...

技巧新定跡(まふ定跡)

December 8, 2016

1/10
Please reload

最新記事

September 30, 2018

Please reload

アーカイブ