機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

2019-03-22から1日間の記事一覧

【強化学習】softmax行動選択

softmax行動選択 具体例 実装 参考文献 softmax行動選択 $\epsilon$-greedy と同様によく用いられる「softmax行動選択」についてご紹介します。 この手法は期待報酬値が高い選択肢の選択確率が高くなるように選択確率を決定します。 具体的には、softmax関数…