首页 > 代码库 > 蔡先生论道大数据之九: 要的就是"快"

蔡先生论道大数据之九: 要的就是"快"

    前面几章节谈论了企业如何利用大数据帮助企业建立精准营销模型,大家了解了"大数据"\"小数据",那么数据本身的问题解决了,今天我说一下另外一个非常重要的概念,就是"即时性"。

    可以说大数据最重要的意义之一是解决了营销上的“实时性”问题,在当下手机、平板多屏运作,快速处理用户的点击信息,分析用户属性,放出购买信息,这样实时的能力在商业中越来越重要。也是大数据在实际应用中需要突破的瓶颈。

    举个例子,2008年前某国每个月都要统计数据并公布消费物价指数(KPI),用来测试市场的通货膨胀率,那时候每年要花费3亿美元,雇用专门人或者公司收集全国几十个城市中物价数据,包括蔬菜价格,出租车价格等等,近8万种价格信息。这些数据属于静态并精准的数据,因为采集数据,结果往往要延后几周,但是在2008年经济危机中,这些精准的数据并没有帮助政府及时对危机做出预警和反应。在大数据时代,只要计算机不停收集新产生的现象,把现象之间做出关联即可。比如如果a和b经常一起发生,那我们只需要关注a发生,必定b也会发生。大数据让我们不再建立在假设的基础上,计算机的计算能力让我们从人工选择关联物和一小部分相似数据的偏见中解脱出来。

    再举个例子,一家全球保健品公司新推出了一种保健品,公司决定在网上投放该产品的广告,对广告公司说新产品针对的客户群体是注重养生的女性白领,广告投放了一段时间后发现,关注该保健品最多依次是女大学生、IT人士、最后才是关注养生的白领。我们可以发现广告投放没有及时的调整投放策略,过去这样的调研或调整需要可能数月的时间,目前利用大数据处理技术可以在数小时之内自动切换调整投放的策略,优化定向条件,这样就会收到很好的效果。过去搞人工是不能可做到如此复杂计算的,需要依靠高效的机器学习或人工智能在大数据上进行计算并即时的除结果(类似基于hadoop的spark+mllib这样的分布式并行内存计算框架加上机器学习算法库来实现)。


wKioL1PAsvjhgBInAAHlAQF8R2g700.jpg

本文出自 “论道大数据” 博客,请务必保留此出处http://bighadoop.blog.51cto.com/2942495/1437331