【朗報】Lightweightくん、やねうら王に初勝利した模様

掲題の通り、山岡さん、加納さんが公開されているデータセットを使って地道に育てていたLW(Lightweight)くんが遂にやねうら王(YaneuraOu NNUE 6.00 64ZEN2 TOURNAMENT)に勝利しました。

最初期は24手で敗北一直線だったことを考えると、かなり感慨深いです。

rheinmetall.hatenablog.com

 

 

厳密にはやね系ソフトにおける勝利は初めてではなく、ちょろっとfloodgateに流した際に勝っているのですが、実はローカル環境での一騎討ちで尽く負けていました。(中盤までは評価値に差が無いものの、途中から段々と差をつけられていき、ジリ貧になって押し負けるようなパターンで負け続けていた)

 

なお、これまでに使った学習データはこちら。

floodgate_teacherの2008~2019

selfplay-300~310

テストデータはGCTと同じくfloodgate_teacher_uniq-test01を使用。

 

selfplay-306までを使った段階では先述の通り負け続けていたのだが、それ以降の307〜310の4回でいきなりやねうら王に負ける気配が無くなりました(試しに先手後手入れ替えて10戦ほどしたが全勝した)。

いきなり伸びた理由は分からないのですが、人間と同じように、将棋ソフトもステップ関数のような段階的な進化をするのかもしれないなと。(経験値溜めたらレベルアップ的な)

 

この辺りの数字的な裏付けはちゃんlogファイルに残してはあるので、これを見てみることで何か分かるかもしれない。

ざっと見た感じlossは順調に減っており、またまだ学習可能なように見えるので、

しばらくはこの方向で学習を重ねてみるつもりです。