首页 > 代码库 > 用户画像知识

用户画像知识

用户画像相关知识点

1、用户画像是什么?

技术分享

用户画像(User Profile),用户信息标签化

用户画像有很多的的标签组成,每个标签都规定了观察、认识、描述用户的角度。标签根据企业业务的发展情况,或多或少,对外而言都是一个整体,这个整体称之为用户画像。

 

2、为什么需要用户画像?

用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理。

大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。

技术分享

用户画像的本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。

 

3、用户画像怎么设计?

一个标签通常是人为规定的高度精炼的特征标识

3、1 数据源分析

构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。

对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式

这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。

  3.1.1 静态信息数据     

      用户相对稳定的信息。

  3.1.2 动态信息数据   

      用户不断变化的行为信息。

      在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。

3.2 目标分析

用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。

3.3 数据建模方法

如何根据用户行为,构建模型产出标签、权重一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事

  3.3.1 什么用户   

      关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

  3.3.2 什么时间     

      时间包括两个重要信息,时间戳+时间长度。

      时间戳,为了标识用户行为的时间点。

      时间长度,为了标识用户在某一页面的停留时间。

  3.3.3 什么地点   

      用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。

  3.3.4 什么内容

      每个url网址(页面/屏幕)中的内容。  

      对于每个互联网接触点,其中网址决定了权重;内容决定了标签。

  3.3.5 什么事  

      用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。     

      不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。

 

用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。

用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:

标签权重=衰减因子×行为权重×网址子权重

如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。

标签:红酒,长城

时间:因为是昨天的行为,假设衰减因子为:r=0.95

行为类型:浏览行为记为权重1

地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7

假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。

则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665

 

4、用户画像怎么开发?

技术分享

 

5、用户画像工作坚持的原则(金融企业)

 

用户画像知识