少し前に山岡さんがdlshogiにおけるKL情報量の調査と時間制御への実装を行っていました。 手数毎におけるPolicyと各子ノードの訪問回数それぞれの確率分布の差異を可視化することで、 将棋、特にdlshogiにおいてはどこに時間をかけて探索するべきなのかがよ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。