機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

2019-06-22から1日間の記事一覧

【強化学習】TD学習

今回はTD学習(Temporal Difference Learning)についてお話します。 TD学習は、現在の状態の状態価値関数を更新する時に、 現在より先の状態価値関数を用いる手法の総称になります。 これから詳しく説明していきます。 最もシンプルな強化学習 強化学習におい…