強化学習調査録

基本

強化学習の応用分野

  • ゲーム(Deep Q Network)
  • 囲碁(Alpha Go)

強化学習の数学的な話

基本的な解法

行動選択手法

代表的な強化学習アルゴリズム

基本的なアルゴリズム

深層強化学習関連

応用

マルチエージェント強化学習

以下のサイトにまとめています。

モデルベース強化学習
方策勾配法
Reward Shaping

ライブラリ(keras-rl, tensorforce等)

深層強化学習ライブラリまとめ

keras-rl
tensorforce

基礎的な手法や基本用語など

基礎用語

参考文献

コメント

タイトルとURLをコピーしました