機械学習(特に強化学習)が好きな人のノート

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

マルコフ決定過程

概要

  • マルコフ決定過程とは、状態遷移は 現在の状態とその時の行動にのみ依存する(マルコフ性) ような確率モデルである。
  • 数学的に分析しやすいので、強化学習などではよく用いられる

参考文献