新たな評価関数のファミリー

July 9, 2017

前回の記事のあとから、凄まじい勢いで新しい評価関数が登場し始めました。プログラマでなくても、ある程度の将棋の知識とコンピュータリソースさえあれば、自分にカスタマイズされた評価関数ができるというのは大きなインパクトが有ったのだと思います。記事のあとも色々な出来事が有りました。

後者については、私のサイトへのメールでyanetesという方からelmoとリゼロepoch8のブレンド(ブリード・キメラ化)が強いのではという示唆をいただき、少し調べてみたら実際結構強い、、そのむねツィートして一日もしないうちにやね氏によるより詳細なデータが登場し、大騒ぎになるという事態になりました。人間の将棋界は藤井くんの活躍で大きな盛り上がりをみせていますが、将棋ソフトの世界もそれに負けない大きな進展  -- ノンプログラマーによるソフト改良 -- により大きなブレークスルーが来るのかなと胸躍る感じです。もしかすると私のような級位者でもコンピュータの助けを借りて将棋の真理に近づけるのかもしれないという希望が出てきました。

私が知っている範囲で新たな評価関数の動きをまとめると(漏れているものがあるようでしたらお知らせください)

くらいでしょうか。現在、出張中ということで機動力が発揮できないということもあり、手元で観察することはできませんがすでに、まふさんのところには膨大なデータが、、現時点で

 

まふ>野生の読み太>relmo>elmo-qhapaq>elmo

 

の順で全体の差は100前後(?)と理解しています。今のソフトはすでに十分強いのでR100違って実用的にどう違うのだ、というつっこみはあると思いますが、ギリギリのチューニングを求める人には最前線を追うのはとても重要なのかもしれません。個人的にはすでに出回っている評価関数とは全く違う育成をして相手の研究の裏をかく(そこまで頑張っているのはかなりの高段者~プロでしょうが)とか、弱い評価関数を色々作って評価関数の味見をするのが面白いかなと思っています。

 

Please reload

特集記事

以前より、私のツィートや記事にコメントをいただいている、コンピュータ将棋に大変詳しい方(まふさんと名乗られています)が、技巧の定跡の開発を始められました。定跡を作るためのデータとして私がレーティング計測用に作った棋譜ファイルを使っていただいているという縁もあり、新定跡のテストを私が担当することになり...

技巧新定跡(まふ定跡)

December 8, 2016

1/10
Please reload

最新記事

September 30, 2018

Please reload

アーカイブ