docs/algo/warp_lda_on_angel.md
WrapLDA是LDA的经典实现之一,WarpLDA中采用Metropolis Hastings (MH) 的方法进行话题采样。而LDA*中采用F+LDA作为话题的采样器
利用MH的方法能够将每次采样的操作降低到O(1)复杂度。但是由于MH采用了近似的方法,WarpLDA需要更多的采样操作,即更多的迭代次数才能收敛,这在分布式环境下意味着更多的网络通信开销。
感谢@Chris19920210 的贡献
WarpLDA的运行方法和参数和LDA*相同
I输入数据分为多行,每行是一个文档,每个文档由文档id和一系列的词id构成,文档id和词id之间由'\t'符合 相隔,词id之间由空格隔开
doc_id '\t' wid_0 wid_1 ... wid_n