ノート

強化学習関連のこと

MENU

遊び実験記録

【強化学習】ε-greedyアルゴリズムでバンディット問題を解く【2】

進捗2 ε-greedy手法で バンディット問題を解いてみた。 (バンディット問題といってもシンプルなやつです) 前回 www.tcom242242.net 目的 ε-greedy行動選択を実装して試したい ちなみにε-greedy行動選択については以下を参照 進捗 ε-greedy行動選択を行いな…

【強化学習】シンプルなマルチアームバンディットプログラムの作成

進捗1 目的 強化学習の様々な行動選択手法を実験的に試したい 進捗 マルチアームバンディットプログラムの実装(シンプルな)。 マルチアームバンディット問題 マルチアームバンディット問題は、 スロットマシンに複数のレバーがついているスロットマシーンを …