首页 > 代码库 > 点击流数据(Click Stream Data)及其应用
点击流数据(Click Stream Data)及其应用
点击流(Click Stream)是指用户在网站上持续访问的轨迹。众所周知,用户对网站的每次访问包含了一系列的点击动作行为,这些点击行为数据就构成了点击流数据(Click Stream Data),它代表了用户浏览网站的整个流程。目前点击流数据的获取方法有很多,例如通过JS进行事件捕获、发布客户端应用进行采集、网站日志分析等等,本文仅以网站日志分析为例进行阐述。
点击流和网站日志是两个不同的概念,点击流是从用户的角度出发,注重用户浏览网站的整个流程;而网站日志是面向整个站点,它包含了用户行为数据、服务器响应数据等众多日志信息,我们通过对网站日志的分析可以获得用户的点击流数据。关于点击流数据更多系统的解释,推荐阅读《点击流数据仓库》一书。
点击流数据是网站运营分析的主要数据依据。基于用户的点击流数据可以进行诸如用户行为、用户忠诚度、用户价值、系统优化等一系列的分析。那么用户的点击流数据都包含哪些?我们该如何获得这些点击流数据呢?让我们先了解一下网站的构成以及用户访问网站的一些基本原理。首先,网站是由多个网页(Page)构成,当用户在访问多个网页时,网页与网页之间是靠Referrers参数来标识上级网页来源。由此,我们就可以确定网页被依次访问的顺序。其次,用户对网站的每次访问,可视作是一次会话(Session),在网站日志中将会用不同的Sessionid来唯一标识每次会话。通过Sessionid与Referrers的结合,我们就可以确定每个用户依次访问网站的网页顺序。如果把Page视为“点”的话,那么我们可以很容易的把Session描绘成一条“线”,也就是用户的点击流数据轨迹曲线。
下面我们来看一下基于Session和Page能提取到哪些常规的点击流数据:
通过上表我们可以很直观的发现,当我们拥有这些信息时,可以很简单的进行很多网站分析的度量计算。例如来源、进入页面、离开页面可以直接获得;平均访问时间和平均浏览页面数也可以通过简单的计算得到;甚至跳出率(Bounce Rate)的计算也变得很简单,只要选择访问页面数为1的即可。
上表只是罗列了一些典型数据信息,其实我们通过Page可以获得更多的点击流数据,例如响应状态码,冗余访问用户的Cookie等。在这里特别说明一下Step,我们可以通过与Session的结合追溯到用户的访问足迹,这在梳理网站流程,计算转化率(Conversion Rate)、分析用户行为时,是非常有用的信息。
总之,基于点击流数据我们可以统计出很多常见网站分析的基本度量。
本文出自 “BillDu” 博客,请务必保留此出处http://billdu.blog.51cto.com/9829964/1603895
点击流数据(Click Stream Data)及其应用