ソフト評価値による人間の対局の勝率予想について

将棋ソフトを用いると対局の各局面における優勢/劣勢の度合いを「評価値」という形で定量的に知ることができます。例えば評価値が300点以内であれば「互角」、300点から800点の間であれば「有利」、800点から1500点の間なら「優勢」、1500点を超えると「勝勢」と判断されます。これは言葉による表現ですが、実際には評価値から各プレーヤーがその局面から指し続けたときの予想勝率を計算することができて、例えば300点だと62%, 800点では79%, 1500点になると92%等となります。この計算の基礎になっているのはPonanza開発者の山本一成氏がツイッターで提案した (勝率)=1/(1+EXP(-(評価値)/600)) という経験式です。この関数はシグモイド関数と呼ばれるものでPonanzaの開発の際に行われた(非常に持ち時間が少ない)自己対局における評価値と勝率の関係として得られたものです。 私は以前よりこの公式を人間の対局に当てはめていいのか疑問に思っていました。その根拠は、上記の経験則はソフト同士の超短時間対局という特殊な条件で導かれたもので、思考方法、棋力、持ち時間など全く異なる人間の対局の場合、設定がだいぶ違うのではと思われた点です。ネットで検索してもこれまであまり調べられたことがなかったようなので、自分で調べてみることにしました。 調査法ですが 棋譜としては手に入れやすかった2002~2003年のプロ棋士の対局約1000局を用いた。 ソフトは最近良く用いられているShogiGUI(インターフェース)+やねうら王(エンジン)+Kristallweizen(評価関数)の組

特集記事
最新記事
アーカイブ
タグから検索
まだタグはありません。
ソーシャルメディア
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square