日出时可多帕西火山,厄瓜多尔科多帕希国家公园。

Diffusion Model 相关文章参考

【知乎】Diffusion Models必读的10篇经典论文

【综述】Diffusion Models发展

【知乎】DDPM与DDIN

提问:怎么理解ELOB公式?

ELBO(Evidence Lower Bound)是VAE模型中优化的目标函数,它可以用来近似原始的对数似然函数(log-likelihood),从而进行模型的训练。

ELBO的公式为:

Eqϕ(zx)[logp(x,z)qϕ(zx)]\mathbb{E}_{q \phi(z|x)}\left[\log\frac{p(x,z)}{q_\phi(z|x)}\right]

其中,p(x,z)p(x,z)表示联合分布,qϕ(zx)q_\phi(z|x)表示后验分布,即在给定输入数据xx的情况下,潜在变量zz的分布。ELBO可以理解为对数似然函数的下界,它的计算过程如下:

首先,将联合分布p(x,z)p(x,z)拆开,得到:

logp(x)=logp(x,z)dz\log p(x) = \log \int p(x,z) dz

然后,对上式应用Jensen不等式,得到:

logp(x)=logp(x,z)qϕ(zx)qϕ(zx)dzqϕ(zx)logp(x,z)qϕ(zx)dz\log p(x) = \log \int p(x,z) \frac{q_\phi(z|x)}{q_\phi(z|x)} dz \geq \int q_\phi(z|x) \log \frac{p(x,z)}{q_\phi(z|x)} dz

上式中,qϕ(zx)qϕ(zx)=1\frac{q_\phi(z|x)}{q_\phi(z|x)}=1,所以等号成立的条件是p(x,z)=qϕ(zx)p(x,z)=q_\phi(z|x),但是通常这种情况很难满足,因此需要使用不等式。

最后,对上式进行期望,即可得到ELBO的公式:

Eqϕ(zx)[logp(x,z)qϕ(zx)]\mathbb{E} *{q* \phi(z|x)}\left[\log\frac{p(x,z)}{q_\phi(z|x)}\right]

ELBO的计算过程中,logp(x,z)qϕ(zx)\log\frac{p(x,z)}{q_\phi(z|x)}可以看作是重构损失(reconstruction loss)和KL散度(Kullback-Leibler divergence)的加权和,其中重构损失衡量了模型生成的样本与原始数据之间的差距,KL散度则衡量了后验分布qϕ(zx)q_\phi(z|x)与先验分布p(z)p(z)之间的差距。因此,通过最大化ELBO,可以同时优化重构损失和KL散度,从而提高模型的泛化性能。