一篇关于SGMCMC的综述文章,优点是给出了详细的实验代码,可复现性强。
MCMC方法已经成为bayes推断的核心方法,但是在实际使用中,全样本的更新效率过于低下,因此借助subsampling的方法,考虑随机梯度更新是更实用的方法。
方法
考虑要取样目标密度
特别的,在多样本情况下,
一种得到抽样的方法是利用马尔可夫链的平稳过程,一种是考虑能量守恒的公式。最终思路都是寻找目的分布的平衡条件。
SGLD
基于Langevin Diffusion的MCMC有两种变形:
1.引入MH拒绝采样的方法MALA,这种方法有好的理论逼近性质,精确度更高。
2.另一种是不引入拒绝采样,直接迭代。
其实这种方法和SGD的区别就是最后引入了一个Gauss噪声,但是这种方法的效果一般比SGD得到的结果要好。
实际使用中还需要考虑方差缩减的问题,方法引入了control variate的方法(与强化学习类似),另一种是直接加权的方法。
下图给出了一般形式: