首页 > 代码库 > 蔡先生论道大数据之三 , 国内互联网公司的大数据应用

蔡先生论道大数据之三 , 国内互联网公司的大数据应用

 上章,我简单描述了国外IT巨头在大数据方面的应用和战略,本章我们来看一下国内互联网公司如何理解大数据的。


    随着互联网各类网络应用的不断深入,中国的大数据技术与应用的快速发展已成为不容忽视的事实。目前国内各IT企业,特别是大型互联网企业,都开始对大数据的存储、处理和应用进行战略布局。

                                   国内BAT公司:)

百度

    百度作为中国最大的搜索引擎,在中国和中文互联网领域各项排行中不是最大就是最多。2012年,百度日均抓取约10亿网页,处理超过100PB(1PB=1024TB)的数据。过去10年,百度网页搜索库已从500万猛增到了500亿个页面。从公开的材料看,百度的大数据战略往往与云计算百度作为中国最大的搜索引擎,在中国和中文互联网领域各项排行中不是最大就是最多。2012年,百度日均抓取约10亿网页,处理超过100PB(1PB=1024TB)的数据。过去10年,百度网页搜索库已从500万猛增到了500亿个页面。从公开的材料看,百度的大数据战略往往与云计算


腾讯

    腾讯自称“目前中国最大的互联网综合服务提供商之一,也是中国服务用户最多的互联网企业之一”,拥有超过7.52亿QQ 即时通讯活跃账户,1亿微信用户、4.25亿微博用户和超过1亿的视频用户。在积累了个人用户多方面的海量数据后,2012年腾讯提出了“大数据营销”的概念。腾讯网总编辑陈菊红表示“将从这些海量数据中挖掘、分辨出用户的行为模式、兴趣偏好等,打造专属于每个人的智慧门户。” 腾讯不仅在各大产品线中都设置了数据挖掘团队,还在和一些第三方数据挖掘公司、营销公司展开合作洽谈,充分挖掘用户在网上的行为、关系、UGC(用户产生的内容)等数据,“通过合理的方法找到对企业有帮助的数据,并且将营销预算合理的分配在为数众多的数据来源平台上”,从而提高营销效率。2011年4月腾讯追加在天津的数据中心建设投资,欲建立亚洲最大的数据储备处理中心。


阿里 淘宝

    相比中国用户最多的两家互联网企业,淘宝在大数据方面的举措丝毫不逊色,因为几乎所有淘宝业务都依赖淘宝数据库。每天大约有6000万用户登录淘宝网,约20亿页面浏览量(PV)。淘宝所使用的OceanBase分布式数据库,在基准数据和增量数据基础上,实现不同部门对数千亿条记录、数百TB数据上的跨行跨表事务共同完成,并支持每天4000~5000万的更新操作。早在2009年淘宝便自建大型数据库,并通过对全国淘宝购买数据的挖掘发布了2011年淘宝中国地图,对其掌握的大量用户交易数据进行了形象的展示。在利用大数据为提高用户购物体验的旗号下,淘宝根据长尾原理充分利用大数据挖掘技术,建设开放平台,提供各种增值服务。


中国移动

    作为中国最大的移动通讯运营商,截至2012年4月底,中国移动用户数已经达到6.7亿。同时,中国移动正在谋求从移动运营商的管道角色向客户端制造和云端服务两个方向发展。而大数据业务的投入,为此提供了机遇。2011年第四季度中国移动先后与内蒙古自治区和黑龙江省签署合作协议,在呼和浩特、哈尔滨建设全国规模最大、技术最先进、能耗最低的云计算数据中心。2012年2月又确定在成都建立西部最大数据中心,完成了其在国内数据中心的三大数据基地布局





微信号: caimin_yyh


wKioL1OxSNLylWVeAACATyG4JX8702.jpg









本文出自 “论道大数据” 博客,请务必保留此出处http://bighadoop.blog.51cto.com/2942495/1432646