首页 > 代码库 > topic model
topic model
0、基石——贝叶斯推断
计算后验概率即为我们对参数的估计:
其中:
? ??——输入数据
? ???——待估计的参数
? ??——似然分布
? ???——参数的先验分布
?
对新样本的预测:我们要估计的概率
1、常用的概率分布
Dirichlet Distribution
2、文本建模
2.1 基本模型——unigram model
最基本的一种文本模型。
我们做这样的假设:语料库是从词表中独立的抽取的个。有似然方程
其中是term[t]出现的次数。我们的目标是估计,根据贝叶斯推断的方法,我们需要引入的一个先验分布。
计算后验概率
?
?
?
?
?
?
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。