ノート

強化学習関連のこと

MENU

2018-07-08から1日間の記事一覧

囚人のジレンマをランダムエージェントで実験

実験もくそもないけど、ちょっと実装してみます。 強化学習エージェントで実装する前にランダムエージェントで、 報酬関数が囚人のジレンマのゲームをやってみます。 問題設定 よくゲーム理論で用いられているものです。 1,2 協調(C) 裏切り(D) 協調(C) 6, 6…