強化学習、マルチエージェント強化学習、その他機械学習全般

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

MENU

2018-07-10から1日間の記事一覧

【マルチエージェント強化学習】Policy Hill Climbing

Q学習のQ値を用いて、方策を山登り的に更新していく手法です。 http://www.cs.cmu.edu/~mmv/papers/01ijcai-mike.pdf Policy Hill Climbing Agent PHCはQ学習を拡張したものになります。 アルゴリズムは以下のようになります。 PHC 通常のQ学習は方策off型で…