Han

Life is a gift, we should celebrate it. We have to dance to show how grateful we are to be alive.

0%

Stochastic Gradient Markov Chain Monte Carlo

一篇关于SGMCMC的综述文章,优点是给出了详细的实验代码,可复现性强。

MCMC方法已经成为bayes推断的核心方法,但是在实际使用中,全样本的更新效率过于低下,因此借助subsampling的方法,考虑随机梯度更新是更实用的方法。

方法

考虑要取样目标密度,考虑形式

特别的,在多样本情况下,,其中是先验,那么此时

一种得到抽样的方法是利用马尔可夫链的平稳过程,一种是考虑能量守恒的公式。最终思路都是寻找目的分布的平衡条件。

SGLD

基于Langevin Diffusion的MCMC有两种变形:

1.引入MH拒绝采样的方法MALA,这种方法有好的理论逼近性质,精确度更高。

2.另一种是不引入拒绝采样,直接迭代。

其实这种方法和SGD的区别就是最后引入了一个Gauss噪声,但是这种方法的效果一般比SGD得到的结果要好。

实际使用中还需要考虑方差缩减的问题,方法引入了control variate的方法(与强化学习类似),另一种是直接加权的方法。

下图给出了一般形式:

image-20221217115218739