機械学習、強化学習の調査録

機械学習関連のことをまとめていきます。強化学習関連が多いかもしれません

2019-06-03から1日間の記事一覧

【マルチエージェント学習、評価用問題】The Gaussian Squeeze Domain

The Gaussian Squeeze Domain(GSD)は完全協調型のマルチエージェントゲームの1つです。 最適化したい目的関数(報酬)は以下の式になります。 $$ \begin{eqnarray} G(x) = x e^{\frac{-(x- \mu )^{2}}{\delta ^{2}}} \end{eqnarray} $$ $\mu$、$\delta$ はシ…