ノート

強化学習関連のこと

MENU

2017-01-15から1日間の記事一覧

ε-greedy行動選択

ε-greedy行動選択の概要 εグリーディ行動選択とは、εの確率でランダムに行動選択、それ以外の確率(1-ε) で最も期待値の高い行動を選択する手法です。強化学習などではよく使われます。 例 下の図のような問題を用いて説明しようと思います。 プレーヤーには…