とりあえず、深層強化学習ライブラリをまとめてみました。
ただ思ったより数が多いので、とりあえず列挙しておくだけです。
まだ完成していませんが、現状を挙げておきます。
最終的には全部試してみたいと思っています。
tensorforce
Tensorflowを用いた深層強化学習ライブラリ。
reinforce.io(https://twitter.com/reinforceio)というイギリスの組織?が管理している
- バックエンド:TensorFlow
- pythonのバージョン:Python3, Python2(Python 2 support was dropped with version 0.5))
- github:https://github.com/tensorforce/tensorforce
- document: https://tensorforce.readthedocs.io/en/latest/
- インストール方法
pip install tensorforce
https://www.tcom242242.net/entry/2019/04/25/183727
keras-rl
Kerasを用いた深層強化学習ライブラリ。
- バックエンド:Keras
- python:Python3で動くのは確認。Python2では未確認(わかる人いたらおしえてください)
- github:https://github.com/keras-rl/keras-rl
- docment: https://keras-rl.readthedocs.io/en/latest/
- インストール方法
pip install keras-rl
https://www.tcom242242.net/entry/2019/04/16/190850
chanear-rl
Chainer を用いた深層強化学習ライブラリ。
Chainerを開発してるPreferred Networksが作成しているので、
日本語で書かれた公式の紹介サイトもある
- バックエンド:Chainer
- github: https://github.com/chainer/chainerrl
- document: https://chainerrl.readthedocs.io/en/latest/index.html
- インストール方法
pip install chainerrl
baselines
複数の深層強化学習アルゴリズムが実装されている。
ライブラリとは言えないかもしれない。
OpenAIが開発している。
baselinesとある通り、研究のためのベースラインとして提供している。
OpenAIが開発しているので、OpenAI gymの問題を解かせるサンプルが多数ある。
- バックエンド:Tensoflow
- github:https://github.com/openai/baselines
machina
Deep Xという日本の会社が作ってる。
恐らく東大の松尾研究室絡みのベンチャー企業かな?
- バックエンド:PyTorch
- github:https://github.com/DeepX-inc/machina
- document:https://machina-rl.org/
Rlib
@todo
- バックエンド:Tensoflow or PyTorch
- github:https://github.com/ray-project/ray/tree/master/python/ray/rllib
- document : https://ray.readthedocs.io/en/latest/rllib.html
Coach
@todo
https://github.com/NervanaSystems/coach
強化学習用ライブラリ
深層強化学習ではないですが、強化学習用ライブラリを1つ紹介します。
trfl
Deep Mindが公開しているTensorFlowを用いた強化学習ライブラリ。
Deep Mindが作っているので、かなりの数のアルゴリズムが実装されている模様
- バックエンド:Tensoflow
- github:https://github.com/deepmind/trfl/
- document :https://github.com/deepmind/trfl/blob/master/docs/index.md
- インストール方法
pip install trfl
コメント