Diffusion Model 相关文章参考
【知乎】Diffusion Models必读的10篇经典论文
【综述】Diffusion Models发展
【知乎】DDPM与DDIN
提问:怎么理解ELOB公式?
ELBO(Evidence Lower Bound)是VAE模型中优化的目标函数,它可以用来近似原始的对数似然函数(log-likelihood),从而进行模型的训练。
ELBO的公式为:
Eqϕ(z∣x)[logqϕ(z∣x)p(x,z)]
其中,p(x,z)表示联合分布,qϕ(z∣x)表示后验分布,即在给定输入数据x的情况下,潜在变量z的分布。ELBO可以理解为对数似然函数的下界,它的计算过程如下:
首先,将联合分布p(x,z)拆开,得到:
logp(x)=log∫p(x,z)dz
然后,对上式应用Jensen不等式,得到:
logp(x)=log∫p(x,z)qϕ(z∣x)qϕ(z∣x)dz≥∫qϕ(z∣x)logqϕ(z∣x)p(x,z)dz
上式中,qϕ(z∣x)qϕ(z∣x)=1,所以等号成立的条件是p(x,z)=qϕ(z∣x),但是通常这种情况很难满足,因此需要使用不等式。
最后,对上式进行期望,即可得到ELBO的公式:
E∗q∗ϕ(z∣x)[logqϕ(z∣x)p(x,z)]
ELBO的计算过程中,logqϕ(z∣x)p(x,z)可以看作是重构损失(reconstruction loss)和KL散度(Kullback-Leibler divergence)的加权和,其中重构损失衡量了模型生成的样本与原始数据之间的差距,KL散度则衡量了后验分布qϕ(z∣x)与先验分布p(z)之间的差距。因此,通过最大化ELBO,可以同时优化重构损失和KL散度,从而提高模型的泛化性能。