首页 > 代码库 > Click Models for Web Search(2) - Parameter Estimation

Click Models for Web Search(2) - Parameter Estimation

在Click Model中进行参数预估的方法有两种:最大似然(MLE)和期望最大(EM)。至于每个click model使用哪种参数预估的方法取决于此model中的随机变量的特性。如果model中的随机变量都是可以observed,那么无疑使用MLE,而如果model中含有某些hidden variables,则应该使用EM算法。

1. THE MLE ALGORITHM

似然函数为:

技术分享

则需要预估的参数的在似然函数最大时候的值为:

技术分享

 

1)MLE FOR THE RCM AND CTR MODELS

RCM:

技术分享

RCTR:

技术分享

DCTR:

技术分享

这几个例子都比较简单,都是简单地基于统计的方式。分子是各自事件的点击数,而分母是各自事件的展现数。

 

2)MLE FOR DCM

在DCM中,从最后一次点击位置的document开始,attractiveness变量就没法obsesrved了,我们不知道是用户因为对最后一次点击的document不satisfy而停止examine接下来的document,还是因为接下来的document不够attractive。而如果我们假设用户对最后一次点击的document是satisfy的,那么attractiveness变量和satisfaction变量都是observed的了。此时就是simplified DCM,有:

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

 

3)MLE FOR SDBN

技术分享

技术分享

技术分享

 

2. THE EM ALGORITHM

 考虑在Bayesian network中的随机变量技术分享和它的父节点技术分享。概率技术分享是参数为技术分享

 

Bernoulli分布。当技术分享或者其父节点中的某个变量无法observe的话,便可以使用EM算法进行参数预估。

 

1)EXPECTATION(E-STEP)

技术分享

技术分享

技术分享

技术分享

 

2)MAXIMIZATION(M-STEP)

技术分享

技术分享

技术分享

 

3)EM ESTIMATION FOR UBM

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

 

3. FORMULAS FOR CLICK MODEL PARAMETERS

技术分享

技术分享

技术分享

 

Click Models for Web Search(2) - Parameter Estimation