首页 > 代码库 > 解决20%的大数据问题
解决20%的大数据问题
一个采用模块化设计的大数据平台可以解决80%的大数据问题,而解决另外20%的问题就要靠大数据平台厂商结合行业客户的特殊需求进行定制化开发。中兴通讯DAP 2.0大数据平台就具备了这方面的能力,能够为行业客户带来实实在在的价值。
大数据的本质在于,可以提升人类活动的准确性,减少传统方式下的试错成本,从而提升社会的整体效率。比如,现在热门的精准营销就是通过大数据提高广告的准确性,减少对无效客户的推送,以提高信息传播的效率。中兴通讯股份有限公司(以下简称中兴通讯)中心研究院副总裁陈坚表示:“归根结底,大数据通过提高人类活动的准确性来提高整个社会的生产效率。”
平台化、模块化架构更灵活
中兴通讯在大数据方面已经进行了多年研究,其研发的DAP大数据平台在电信、金融、智慧城市、公安等行业广受用户好评。在近日举行的第四届大数据世界论坛(BDWF 2014)上,中兴通讯的大数据平台DAP 2.0荣获了“最佳大数据平台管理方案奖”。
中兴通讯中心研究院总工王德政将DAP 2.0的特点归纳成三个方面。
第一,DAP 2.0采用货架式架构和企业总线ESB技术,可以灵活地对各个组件模块进行裁剪和拼装,以满足集成与被集成的要求。当前,各个行业已有大量的生产系统在线运行,完全重构这些系统无论是从经济成本还是时间成本上来衡量都是用户无法承受的。因此,大数据系统必然要同时承担集成与被集成两种角色,即大数据系统既可以作为原有生产系统的一个子系统被集成,也可以作为主系统去集成原有的生产系统。DAP 2.0的货架式架构可以灵活适应各类集成与被集成的应用场景,在不影响生产系统稳定性的前提下,与原有生产系统无缝集成。
第二,在数据分析和挖掘层面,DAP 2.0具有智慧生成的特征,可以提高企业活动的准确性。大数据系统是否具有智慧,从而替代人类专家,将是区分大数据系统与传统IT系统的关键特征。一个无法生成智慧的系统,无论数据量有多大,充其量也就是一个大型的传统IT系统,而不是大数据系统。DAP 2.0通过有针对性的挖掘算法改进,可以提出超越人类专家经验与直觉的智慧建议,从而提升人类活动的准确性,提高社会生产力。
第三,DAP 2.0具备平台的特性。DAP 2.0作为中兴通讯公司级的大数据平台,聚焦于数据的存储、处理时效和挖掘算法,为上层应用破解大数据应用的技术难点与障碍,并可根据上层应用的需求,快速进行定制开发,在很短的时间周期内,以更低的研发成本推出新的大数据应用。未来,DAP 2.0还将向第三方开放,以支撑第三方的大数据业务开发。
现在市场上有许多大数据产品,其中很多是开源软件。因此有人认为,只要下载一个大数据开源软件,自己编译一下就可以用,无需开发专用的大数据平台软件。“其实,对大数据的初始认知与大数据的工程实践之间有很大差距。大数据处理看上去似乎很容易,但如果涉及几百台设备的大数据真实环境,并不是每个企业都有能力自己完成大数据项目的实施。”陈坚告诉记者,“将相关的开源软件、商用软件和自己开发的软件进行整合,特别是实现统一、高效的管理是对大数据厂商的一个最基本要求。另外,大数据平台还要根据不同行业客户的需求进行专门的优化和改进,这也要求大数据厂商具备极强的技术能力。中兴通讯在大数据方面投入了大量人力和物力,不仅可以实现对相关软硬件的集成,而且可以针对不同行业的需求对大数据平台进行优化。”
王德政补充说:“DAP 2.0从技术架构上保证了大数据项目实施的可靠、稳定和高效。比如,DAP 2.0采用模块化的架构,改动其中任意一个模块并不会影响整个系统的功能和稳定性。另外,我们可以针对不同行业的具体需求进行大数据平台的定制,而这个具有行业特征的大数据平台一旦在某个行业的一个用户中成功实施,就可以在整个行业中复制和推广。”
大数据平台有明显的行业特性。一个通用的大数据平台并不能被行业用户直接采用,而是要根据行业需求进行建模和算法优化,才能发挥其应有的作用。打个比方,如果一个通用的大数据平台能够满足客户80%的需求,那么另外20%的工作就是要结合客户的具体需求进行二次开发和优化。
大数据平台水到渠成
大数据处理技术,特别是云存储与云计算技术的成熟与广泛应用,为大数据的存储与处理提供了技术可能性。企业可以利用生产系统和管理系统中产生的大量数据,对自己的生产活动进行更为准确的预测与指导,从而提高企业生产活动的准确性。另一方面,企业还可以通过对数据价值的挖掘,创造出更多新型业务。
电信行业是大数据应用最典型的一个行业。比如,电信运营商可以通过智能终端采集的大量数据了解网络运行的状况或判别网络故障,以便及时进行优化,从而改善客户的应用体验。智慧城市是另一个大数据应用的典型场景。智慧城市的其中一个职能就是将海量数据收集上来,以改进城市基础设施,方便百姓生活。陈坚表示,大数据就是将以前只有少数专家才做的数据分析和挖掘,通过建模和算法更加高效、方便地实现,让广大消费者受益。
中兴通讯作为电信领域的专家,可以针对电信大数据进行专家级的建模。中兴通讯的大数据平台DAP 2.0可以利用云存储与云计算等技术,对海量的数据进行存储、挖掘和分析,以帮助企业充分挖掘数据的价值。
陈坚表示,中兴通讯进入大数据领域其实是水到渠成的事。10多年前,中兴通讯做网管软件其实就是在进行大数据的处理。之后,中兴通讯开始了对云计算、云存储技术的研究,并将不同时期的相关技术进行整合,包括Hadoop、实时分析技术等,才逐渐形成了今日的DAP大数据平台。另外,DAP还融入了中兴通讯对开源软件的深刻理解,同时包含了中兴通讯在工程实施方面的多年实践经验。因此,陈坚认为,中兴通讯的大数据平台是一个技术的集大成者,也是技术自然演进的产物。
虽然中兴通讯大数据平台的产生与中兴通讯在电信领域的技术积累和实践经验密不可分,但是陈坚明确表示,DAP大数据平台是一个通用的组件化的产品,各个层次与模块之间是松耦合的关系,能够广泛应用于不同的行业和应用场景。
一个标准化的大数据系统,通常包括三个层次:最底层是数据采集层,中间层是数据存储、加工和挖掘层,最上层是数据建模与应用层。对于大数据平台来说,其聚焦点是数据存储和分析挖掘,而对于大数据应用来说,其聚焦点是数据采集与建模应用。谈到DAP大数据平台未来的发展方向,陈坚概括说:“我们的重点将放在计算、存储、分析和挖掘领域,目标是让数据挖掘更容易,分析更方便。另外,在数据采集层,我们希望实现更有效的数据接入,让数据的交换和共享更容易。在应用层,我们的策略是开放接口,与行业用户一起建模,以便更好地挖掘行业数据。”
降低大数据的应用门槛
云计算从概念的炒作到应用落地,中间经过了几年时间。与云计算需要寻找适合的应用切入点和商业模式不同,大数据的概念从提出到转化为应用的速度非常快。这是因为,数据处理和挖掘是行业用户的必然需求,而以前只是因为工具的限制,抑制了行业用户的需求。随着大数据技术的成熟和工具的丰富,行业用户的大数据需求一下子爆发出来。陈坚也认同此观点:“大数据平台可以提升数据处理和挖掘的效率,为用户带来实实在在的价值,最典型的例子就是精准营销。数据拥有者本来就具有大数据处理的冲动,这在智慧城市、公安等领域表现得十分明显。”
目前国内外的电信运营商,还有金融、智慧城市、公安等行业的客户都已经部署了中兴通讯的大数据平台。陈坚举了一个电信行业的大数据案例。当客户对电信运营的服务质量不满意时,往往只有少数用户会拨打客服电话投诉。而这些不满意的客户,很可能会在自己的亲友中传播大量的负面情绪。电信运营商如果通过客服系统主动、大面积撒网去消除这种负面影响,需要付出高昂的代价。而通过收集电信系统中的过程信令数据,加以分析和挖掘,就可以发现客户体验最差的客户群,并对这些特定客户进行主动关怀,从而提高关怀行为的准确性,以较低的代价,主动***影响。
中兴通讯除了可以提供大数据平台软件以外,还提供方便中小企业用户使用的易扩展的大数据一体化解决方案。王德政表示,大数据的落地要考虑两方面因素:一是技术可行性,二是经济可行性。从目前情况看,与大数据相关的技术问题已经基本解决,而降低大数据应用的门槛,让大数据真正给客户带来商业价值是行业客户在部署大数据时要着重考虑的问题。
本文出自 “郭涛的存储世界” 博客,请务必保留此出处http://gtstorageworld.blog.51cto.com/908359/1535638