機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

2019-07-13から1日間の記事一覧

マルコフ決定過程(Markov decision process)

今回はマルコフ決定過程(Markov decision process)を紹介します。 マルコフ決定過程は確率過程の一種で、強化学習のタスクとしてよく用いられます。 Markov decision processの頭文字をとってMDPと呼ばれます。 マルコフ決定過程は、以下の要素から構成され…