昨日の HDP-LDA の更新式導出のついでに、ICML 読み会で紹介した教師ありノンパラ LDA である (Kim+ ICML2012) Dirichlet Process with Mixed Random Measures (DP-MRM) の更新式も導出しておこう。
DP-MRM のモデルについては ICML 読み会での発表資料参考。
Teh さんの HDP の論文では、実装に必要になる f_k の一般式までしか書かれていなくて、HDP-LDA の場合の書き下しが行われていなかったのだが、DP-MRM でも同じように f_kl という式に帰着して、でもその f_kl は具体的には書き下されていないというスタイルになっている。いやそんなところは真似しなくても。
なので、その f_kl を展開してみよう。
where
こうやって天下りで与えられると意味不明だが、、例によって を f_kl と書いているだけである。
DP-MRM でも HDP-LDA と同じく f(x|φ) は単語の多項分布 Multi(φ)、h(φ) は単語分布を引くディリクレ分布 Dir(β) という設定なので、これを上の式に放り込む。
v=x_ji, t=t_ji, k=k_jt, l=l_jt ということにしつつ、、-ji が付いた場合はそこから x_ji を除いたもの、といういつもの記法も使って計算していく。
HDP-LDA とほとんど同じ流れなので、細かいところは省略。
【2012/08/22 修正】
ああ、そう言えば、[Kim+ ICML2012] の式 (9), (10) に出てくる は の間違い。