首页 > 代码库 > 《大数据时代的历史机遇》读书心得

《大数据时代的历史机遇》读书心得

作者:易仔阿克    时间:2014-08-06

博文标题:《大数据时代的历史机遇》读书心得

大数据资产价值评估模型:规模、颗粒度、多维度、关联性、活性。前四个侧重从空间角度,最后一个侧重在时间角度。规模是指数据的多少,数据量当然是越大越好。颗粒度只是数据的粒度,当然是数据粒度越细越好,粒度越细越便于分析。多维度是指数据视角多少,当然是维度越多越好,这样便于从多个视角查看。关联性是指属于与其它数据的关系,关联越多越好,越能够发现规律。活性是指数据的更新频率,数据活性越大,越能够实时地反映事物的行为特征。

举例:

1、规模:数据一般分为结构化和非结构化数据,一般的数据库属于关系型数据库,存储结构化数据为主,级别在TB一级。随着数据的积累,比如通话详单,会变得越来越大,甚至达到PBEBZB一级。这么海量的数据,可以采用Hadoop等云化计算进行分析,找出规律。

2、颗粒度:拿淘宝等电子商务网站来说,颗粒度一般是以用户为中心的属性与浏览、购物车、购买、咨询、建议、退换货、投诉等行为信息。拿百度等信息搜索网站看,不一定实名记录,一般包括用户关键字搜索、歌曲收听、视频查看、浏览等信息。拿用户打电话来说,如果能够到网络信令一级,不但能够看到用户拨打记录,还能够看到用户移动轨迹,进而可以判断用户特点,比如属于经常出差型还是属于宅男型等。颗粒度越细,越能够发现规律。

3、多维度:那一个用户来说,如果你仅仅知道他的姓名、住址、电话等信息,你对他的了解很有限,如果你知道他的体育爱好,比如打篮球,打乒乓球,文化爱好,比如喜欢读文学作品等,你可以对他进行更加有针对性的营销,比如推进NBA球星的球鞋、推荐《史记》、《全球通史》等书籍,这样成功的概率就大很多。

4、关联性:世界是普遍联系的,最直接的是每个人在社会活动中形成了同学、朋友、同事、战友等社会关系,如果你知道他的这些社会关系,就可以利用这些关系进行信息的传播。现在facebooklinkin、朋友圈、开心网等社交网站就是构建个人社会圈子,让人与人可以在虚拟世界中进行沟通交流。

5、活性:数据是否新鲜也很重要。拿银行借贷业务和手机通话记录做比,一般来说,我们的工资每月发送一次,而手机通话则每天每小时都会产生,详细地记录了一个人与其他人交往的记录,加上个人在互联网中娱乐、购物等记录,形成了一个人完整生活轨迹的画像。

    总之,大数据从静态(结构、粒度、多少、联系)以及动态(活性)角度来评估其价值,是非常有参考意义的。当然,大数据资产价值评估模型也不止于这几个方面,可以根据行业特点和特定环境进行删减补充。


本文出自 “易仔阿克的博客” 博客,请务必保留此出处http://lifudong.blog.51cto.com/2357095/1536330