強化学習、マルチエージェント強化学習、その他機械学習全般

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

MENU

行動選択

【強化学習】softmax行動選択

softmax行動選択 具体例 実装 参考文献 softmax行動選択 $\epsilon$-greedy と同様によく用いられる「softmax行動選択」についてご紹介します。 この手法は期待報酬値が高い選択肢の選択確率が高くなるように選択確率を決定します。 具体的には、softmax関数…