マルチエージェント強化学習とは
マルチエージェント強化学習は、
複数の強化学習エージェントが同時に学習行動を行う 自律分散型の学習フレームワークのことを言います。
マルチエージェント(マルチエージェントシステム)は、複数(マルチ)のエージェントが相互作用しているシステムです。
エージェントとは、主体的に行動する人間、動物やロボットなどを一般化したものになります。
また、強化学習とは、試行錯誤によって行動方策を学習していく学習フレームワークになります。
強化学習については以下の記事にまとめています。
マルチエージェント強化学習とは、 同じ環境で複数の強化学習エージェントが同時に学習して行動し、相互に影響を及ぼしている学習フレームワークです。
マルチエージェント強化学習では、あるエージェントの行動(選択)が、その他のエージェントに影響を与えます。
そのため、シングルエージェントの強化学習に比べて考慮点が多くなり複雑な問題となります。
分散型のシステムではあればマルチエージェント強化学習問題を適用できるタスクとなります。
例えば、複数エレベータの制御、交通信号機の制御にも適用できます。
人間社会も複数の人(エージェント)が同時に学習しているので、マルチエージェント強化学習といえます。
マルチエージェント強化学習の種類
マルチエージェント強化学習には
- 協調型(全エージェントが受け取る報酬が同じ)
- 対戦型(あるエージェントの利益はその他のエージェントにとっての損益)
- Mix(その他)
など様々な形式が考えられます。
コメント