以下の書籍を参考にGolangでバンディットアルゴリズムを実装してみた。 書籍に載っているEpsilon-Greedy、Softmax、UCB1を実装してから、Epsilon-GreedyとSoftmaxはAnnealingを追加してみた。 書籍ではPythonでtsvファイルを生成してからRで可視化しているけ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。