機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

2019-04-20から1日間の記事一覧

状態価値関数と状態行動価値関数について

今回は、強化学習で重要な状態価値と状態行動価値についてお話しようと思います。 状態価値関数$V(s)$とは、名前の通り各状態$s$の価値であり、 状態行動価値関数$Q(s, a)$とは、各状態$s$での各行動$a$の価値を表しています。 ここで言う価値というのは期待…