tocomの調査録(機械学習、強化学習多め)

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

深層強化学習のライブラリまとめ

とりあえず、深層強化学習ライブラリをまとめてみました。
ただ思ったより数が多いので、とりあえず列挙しておくだけです。
まだ完成していませんが、現状を挙げておきます。
最終的には全部試してみたいと思っています。

tensorforce

Tensorflowを用いた深層強化学習ライブラリ。
reinforce.io(https://twitter.com/reinforceio)というイギリスの組織?が管理している

pip install tensorforce

www.tcom242242.net

keras-rl

Kerasを用いた深層強化学習ライブラリ。

pip install keras-rl

www.tcom242242.net

chanear-rl

Chainer を用いた深層強化学習ライブラリ。
Chainerを開発してるPreferred Networksが作成しているので、
日本語で書かれた公式の紹介サイトもある

pip install chainerrl

baselines

複数の深層強化学習アルゴリズムが実装されている。
ライブラリとは言えないかもしれない。
OpenAIが開発している。
baselinesとある通り、研究のためのベースラインとして提供している。
OpenAIが開発しているので、OpenAI gymの問題を解かせるサンプルが多数ある。

machina

Deep Xという日本の会社が作ってる。
恐らく東大の松尾研究室絡みのベンチャー企業かな?

Rlib

@todo

Coach

@todo

https://github.com/NervanaSystems/coach

強化学習用ライブラリ

深層強化学習ではないですが、強化学習用ライブラリを1つ紹介します。

trfl

Deep Mindが公開しているTensorFlowを用いた強化学習ライブラリ。
Deep Mindが作っているので、かなりの数のアルゴリズムが実装されている模様

pip install trfl

つくりながら学ぶ! 深層強化学習 ~PyTorchによる実践プログラミング~

つくりながら学ぶ! 深層強化学習 ~PyTorchによる実践プログラミング~