Professional Documents
Culture Documents
Graphical Model
Joint distribu!on
p(x, z, β∣α)
= p(x, z, β)
N
= p(β∣α) ∏ p(xn , zn ∣β)
n=1
N
= p(β) ∏ p(xn , zn ∣β)
n=1
这⾥里里α是hyperparameter,其取值是确定的,所以常常常常可以参略略不不写。每个zn 都是
个集合,其中包含⼀一组变量量zn,j with 1 ≤ j ≤ J 。
全局变量量的Complete condi!onal
p(β∣x, z, α)
= p(β∣x, z)
= h(β)exp{ηg (x, z, α)T t(β) − ag (ηg (x, z, α))}
= h(β)exp{ηg (x, z)T t(β) − ag (ηg (x, z))}
p(zn,j ∣z¬(n,j) , x, β)
= p(zn,j ∣xn , zn,¬j , β)
= h(zn,j )exp{ηl (xn , zn,¬j , β)T t(zn,j ) − al (ηl (xn , zn,¬j , β))}
p(z, β, x)
p(z, β∣x) =
∫ ∫ p(z, β, x)dzdβ
因为分⺟母的计算很困难,通常需要近似的⽅方法来求解。
常常采⽤用⼀一种简单的被称为mean-field变分分布家族来近似隐变量量的后验分布。在mean-
field分布家族中,每个隐变量量是互相独⽴立的。
N J
q(z, β) = q(β∣λ) ∏ ∏ q(zn,j ∣ϕn,j )
n=1 j=1
全局变量量对应的varia!onal distribu!on
局部变量量对应的varia!onal distribu!on
注意这⾥里里的q(β∣λ)和之前的p(β∣x, z)中的h(β)以及t(β)是相同,因为两者都属于相同
的exponen!al family。
ELOB
p(x, z, β) q(z, β)
log p(x) = Eq(z,β) [log ] + Eq(z,β) [log ]
q(z, β) p(z, β∣x)
= L(q(z, β)) + KL(q(z, β)∣∣p(z, β∣x))
L(q(z, β))
= Eq(z,β) [p(x, z, β)] − Eq(z,β) [q(z, β)]
Op!miza!on
全局隐变量量参数的优化
N J
这⾥里里q(¬β) = ∏n=1 ∏j=1 q(zn,j ∣ϕn,j )
其中
所以可得
q ∗ (β∣λ) ∝ exp(log h(β) + Eq(¬β) [ηg (x, z)]T t(β))
∝ h(β) exp (Eq(¬β) [ηg (x, z)]T t(β))
可以推导出
局部隐变量量参数的优化
其中
可以推导出