ノート

強化学習関連のこと

MENU

todo

【編集中】EMアルゴリズム

※編集中 概要 2つの変数からなる確率分布p(x,z)が与えられている. しかし、我々が観測可能なのはXのみ観測可能であり、Zは実際には見えない。 Xしか観測できないが、p(x,y)の推定を行う 尤度関数 $l(\theta)$ の最大化を行う \begin{align} l(\theta) &= \su…