首页 > 代码库 > 从风险管理的角度来看是否须要个性化推荐

从风险管理的角度来看是否须要个性化推荐

一  背景

1、现今 ,个性化技术被广泛用于推荐系统 。 特别是基于用户的偏好数据进行个性化预測的

协同过滤算法,已被证是实际可行的。然而 在某种程度上我们并不知道个性化推荐是否总是

能优于非个性化推荐.《Performance of recommender algorithms on top-n recommendation

tasks》已证实基于热门的推荐也有相当好的效果。下图是Bayesian personalized ranking 

和 popularity-based 推荐算法的结果比較(基于MovieLens的数据集)。


技术分享 

尽管总体上BPR算法占优 , 可是也有非常大的部分热门占优。三个图分别基于不同的推荐

结果精确度评定算法。

详细Learning to Rank for IR的评价指标 


2、从学习模式的角度来看 , 个性推荐能预測出用户的偏好。但会非常敏感 。非个性化推

荐相反。如何比較个性化推荐和非个性推荐?我们引入金融领域的风险管理的概念。我

们通过使用MPT(Modern Portfolio Theory)来对推荐列表(包含两种推荐算法)进行优化

。能够把推荐列表看作是一个投资组合(推荐列表的每个item相当于投资组合里面的股

票 , 某个item在列表中的位置能够觉得是投资组合中某个股票的权重)


二 推荐风险分析

     1、基本定义

             1)、投资组合:  投资组合是一个包括n个具有相应权重的item的集合 , 权重与item的

               重要性相关

技术分享

            2)、用户对投资组合 的偏好程度 , 某个用户对投资组合中item i的喜好程度由ru,i

               表示

技术分享  

User 对投资组合的偏好程度的期望与方差

技术分享

3)对于某个用户来说,当且仅当满足例如以下关系时投资组合1优于投资组合二

                              技术分享

           4)、 有效边界

               用来描写叙述一项投资组合的风险与回报之间的关系,在以风险为横轴。预期回报率

               为纵轴的坐标上显示为一条曲线。全部落在这条曲线上的风险回报组合都是在一

       定风险或最低风险下能够获得的最大回报 , 如图

技术分享

                    最佳投资组合的查找 ,  假设在给定投资组合的预期回报(mean)的情况下 。

               那么就是在有效边界上找风险最 小的 点。

技术分享  

           2 、两个投资组合的风险对照

               拿经典的Bayesian personalized ranking (BPR)算法和popularity-based 

               recommendation (POP)对照分析

                  1)、用4 个典型的风险-回报 图 阐明个性化推荐与非个性化推荐之间

                           的关系

技术分享

技术分享

技术分享

技术分享

2须要三个层面来分析孰优孰劣

(1) 、物品层面: 

       须要计算出用户u与投资组合P中item i偏好程度的期望与方差;基于隐语

       言模型的贝叶斯线性回归。

(2)、投资组合层面:

       基于上一步的期望与方差。计算物品在投资组合中的权重(即排名)

(3)、两个投资组合比較层面;

       採用mean-variance-aware switch algorithms进行终于的推荐选择


三 投资组合切换决策算法

    1、单个item层面的评估,须要关注用户对item的偏好程序的期望和标准差。对于用

           户对item评分的概率分布,在此使用probabilistic matrix factorization来建模,

验分布 例如以下

技术分享

  后验分布;

技术分享

  

        用户对item评分的高斯分布为:

技术分享

期望和方差为:

技术分享


物品的相关性能够用 knn 或 皮尔逊相关系统算出

  

2、投资组合优化

   主要关注投资组合中物品的权重优化分析。

   以下又一次定义用户的投资期望 。 b是用户的风险规避系数 。

被减数是

    期望。 凑数是方差乘以系数。

   技术分享


 那么如今的期望-风险系统数就变成了二次曲线。有效边界与二次曲线的切点就

是该点的权重

技术分享

    

3、选择算法

     技术分享

期望优先:

技术分享

风险优先:

技术分享


       等其他算法



        

  


   这仅仅是初读论文。兴许会跟进对应的推导过程解析

  引用论文  To personalize or not: A risk: management perspective

   

     

        

   

         

从风险管理的角度来看是否须要个性化推荐