首页 > 代码库 > 到底什么才是大数据
到底什么才是大数据
作者:易仔阿克 时间:2014-08-06
博文标题:到底什么才是大数据
多年来一直从事信息化相关工作的朋友,对于IT界传出的各种新鲜词汇从来都不会感到陌生,勤奋而努力的IT人在实现让技术改变世界梦想的同时,也一次次革着自己的命,用热情和汗水推动着行业与社会的发展变革。
那么,面向服务的架构、分布式计算、并行计算、网格计算、云计算、大数据、移动互联网、物联网、智慧城市、智能交通、智慧地球等概念的推出就不足为奇了。正所谓:没有做不到的,只有想不到的,神奇的IT人借助科学技术的力量,改变着我们的工作和生活。
近几年来,随着信息系统日益成熟以及互联网的迅猛发展,在各行各业的数据库中沉淀了大量的数据,这些数据记录下了组织各种活动的历史,对于人们基于过去预测未来具有重要的参考价值,同时这些数据又有不同于以往数据的特征:数据量极大(姑且定义为EB级吧,量大无止境...)、类型多样(包括文本、语音、视频、图片、邮件、网页等非结构化数据,类型也是无止境啊...)。为了让这些数据推动社会的发展进步,业界将其命名为“大数据”。
其实,在大数据出现以前,组织早已着手利用数据为自身服务,这些应用包括最简单的统计分析,通过报表查看汇总数据。再后来有提出了商业智能,通过对生产型数据进行抽取、转换、装载等,形成数据仓库,然后面向不同的主题,形成不同的数据集市。由于今天的数据量太大了,我们甚至难以量化它的大小,为了表达我们对海量数据的敬畏,我们用多少有些形容的口气,称之为“大”数据。
(结束)
本文出自 “易仔阿克的博客” 博客,请务必保留此出处http://lifudong.blog.51cto.com/2357095/1536326