首页 > 代码库 > 大数据处理仅有Hadoop是不够的
大数据处理仅有Hadoop是不够的
自从三大数据库厂商甲骨文、IBM和微软在2011年不约而同地宣布支持Hadoop后,在企业级市场上,Hadoop基本上也充当着大数据的代名词。时至今日,这种状况或许应该改变了。
NoSQL日渐重要
由于Hadoop的高调,很少有人注意到,在宣布支持Hadoop的同一年,这三大关系型数据库厂商还分别宣布支持非关系型数据库NoSQL。
作为开源软件,NoSQL(Not only SQL,不仅仅是SQL)的诞生和发展也是为了满足Web 2.0特别是社交网络对于数据库“三高”的需求,即对数据库高并发的读写、对海量数据的高效存储与访问、对数据库的高可扩展。这些恰好是关系型数据的短板所在。
然而,要把在互联网上如鱼得水的NoSQL,应用到企业级市场有点令用户不能完全放下心来。毕竟,互联网极少跑关键业务应用,而且哪个互联网巨 头没有中断过服务,但宕机对于互联网公司来说,更多的是灰头垢面,比较难堪而已。但对于那些把企业的身家性命都搭在IT之上的企业级用户而言,其关键业务 应用是容不得半点闪失的。
“Oracle NoSQL Database分为免费和付费两个版本,同时提供商业支持。作为可扩展、高度可用的键值数据库,Oracle NoSQL Database通过与Oracle Event Processing集成,提供可扩展的键/值存储,从而可高效捕获实时大数据。”甲骨文公司副总裁及大中华区技术总经理喻思成表示,
喻思成介绍说,基于近几年的发展,在真正企业级的应用层面,付费商用版更多地被客户认可。如Visa公司最近部署了NoSQL,来检测盗刷卡情 况的发生。“很多企业在发展到了Hadoop层面时,或者大数据技术带来一定价值后,业界需要一家厂商,来全面支持以上所有的架构,这也同时证明了甲骨文 在大数据层面的行业领袖地位。凭借Hadoop、NoSQL和SQL的共存与融合,大数据技术将会有更高的成熟度。”
整体解决大数据
“结构化数据和非结构化数据彼此间是并存、包容的关系,对两者处理的整合构成了完整的大数据处理。”喻思成认为,“收购SUN后,甲骨文具备了软硬件的整合能力,进而形成集成系统,为客户提供具备大数据完整处理能力的解决方案。”
据介绍,NoSQL在非结构化处理上,是通过与Oracle Event Processing(OEP)集成,实现高效捕获实时大数据,然后通过MapReduce的方法进行处理和查询。OEP构建的实时筛选、关联和处理事件 的应用,有助于消除、整合、关联和筛选数据,避免数据仓库杂乱不堪,从而具备实时分析大量数据流的能力。
Hadoop出现后,甲骨文通过Hadoop企业版和Oracle NoSQL数据库,构建大数据处理平台。
之后,甲骨文又通过融合数据库引擎(DBE)、存储、服务器和光纤,形成了Oracle Exadata处理结构化数据的数据库云平台。再通过Oracle 大数据连接器优化了 Hadoop 与 Oracle 数据库和 Exadata 之间的集成,将Hadoop系统无缝地连接到Oracle数据库系统中,实现非结构化和结构化数据的拼接,从而形成完整的大数据解决方案。
在数据分析上,Oracle Exalytics商务智能云服务器采用业界标准硬件、商务智能软件和内存数据库技术而开发,是全球首款专门为提供高性能分析、建模、发现和规划而设计的 集成系统。它通过超高带宽的infiniband总线从Oracle Exadata上加载和读取数据。
在决策支持阶段,信息从不同的源系统加载,存储在可动态支持变化数据的分面数据模型中。作为企业信息探索的利器,Oracle Endeca information Discover被用于对这些多维多变数据进行高级、直观的探索和关联分析。
“凭借全面、软硬一体化、高性能和高性价比的突出特点,目前,Oracle大数据解决方案已获得众多企业用户的支持。”喻思成表示。
大数据处理仅有Hadoop是不够的