機械学習(特に強化学習)が好きな人のノート

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

2018-05-31から1日間の記事一覧

【強化学習】シンプルなマルチアームバンディットプログラムの作成

進捗1 目的 強化学習の様々な行動選択手法を実験的に試したい 進捗 マルチアームバンディットプログラムの実装(シンプルな)。 マルチアームバンディット問題 マルチアームバンディット問題は、 スロットマシンに複数のレバーがついているスロットマシーンを …