首页 > 代码库 > 概率论杂记

概率论杂记

摘要:

  1.本福特定律

  2.商品推荐的惊喜度

  3.贝叶斯学派和频率学派

  4.指数分布族

  5.期望

  6.方差

  7.协方差

  8.皮尔逊相关系数

1.本福特定律

github代码部分 

 

2.商品推荐的惊喜度:

商品推荐场景中过于聚集的商品推荐往往会损害用户体验,在有些场景中,系统会通过一定程度的随机性给用户带来发现的惊喜度。假设A,B商品与当前用户的匹配度分别为0.8,0.2,系统将随机为A生成一个均匀分布于0到0.8的最终得分,为B生成一个0到0.2的得分,问终B的得分大于A的得分的概率?

技术分享

 

3.贝叶斯学派和频率学派(参数空间,统计推断):

贝叶斯学派:假定参数本身是变化的,服从某个分布。求在这个分布约束下使得某目标函数极大/极小(贝叶斯模型)

频率学派:假定参数是某个/某些未知的定值,求这些参数如何取值,能够使得某目标函数取极大/极小(矩估计,似然估计,最大熵,期望最大化等)

扩展:知乎问答

 

4.指数分布族:

技术分享

注:验证高斯分布属于指数分布族

 

5.期望(expectation)

概率加权下的平均值

技术分享

阿里试题1:从1,2,3,...,98,99,1024这100个数中任意选择若干个数求异或,则异或的期望值是什么?

解:若干个数异或,只有当某位取奇数个1时第i位才为1,故此题只要考虑各个位数取1的概率即可

1024的二进制表示为100,0000,0000,明显这里第7,8,9位不为1,,而其余99个数也取不到这3位,则有 

技术分享

而对于其余位,有如下计算:

技术分享

技术分享 

阿里试题2:

技术分享

技术分享

由二项分布的期望,有np=1,得S的元素个数是1024

 

6.方差:

技术分享

 

7.协方差:

技术分享

技术分享

协方差矩阵式对称阵

 

8.相关系数

技术分享

扩展:常见的距离算法和相似度(相关系数)计算方法

 

概率论杂记