遊び実験

マルチエージェント強化学習

Win or Learn Fast PHC をじゃんけんゲームで実験

同じく、前回の記事でも用いた論文で、 紹介されているWin or Learn Fast PHC(WoLF-PHC)を実装して実験してみました。 Win or Learn Fast PHC 前回の記事参照 問題設定 今回はじゃんけんゲーム...
ゲーム理論

Policy Hill Climbingエージェントで実験

ランダムエージェントでの実験 Policy Hill Climbing で実験 以下の論文で、紹介されているPolicy Hill Climbing(PHC) を実装して実験してみました。 問題設定 よくゲーム理論で用いられているものです...
ゲーム理論

囚人のジレンマをランダムエージェントで実験

実験もくそもないけど、ちょっと実装してみます。 強化学習エージェントで実装する前にランダムエージェントで、 報酬関数が囚人のジレンマのゲームをやってみます。 問題設定 よくゲーム理論で用いられているものです。 1,2 協調(C)...
タイトルとURLをコピーしました