首页 > 代码库 > Hadoop之MapReduce程序开发流程

Hadoop之MapReduce程序开发流程

摘要:MapReduce程序开发流程遵循算法思路、Mapper、Reducer、作业执行的步骤。

关键词:MapReduce 程序   开发流程

对于一个数据处理问题,若需要MapReduce,那么如何设计和实现?MapReduce程序基础模板,包含两个部分,一个是map,一个是reduce。map和reduce的设计取决解决问题的算法思路;而map和reduce的执行需要作业的调度。

因此,MapReduce程序开发可以遵循以下流程。

第一步:清楚问题是什么,确定解决问题的算法思路。

第二步:设计和实现mapreduce程序中的Mapper。

第三步:设计和实现mapreduce程序中的Reducer。

第四步:设置作业调度。

mapreduce程序与很多编程有所不同,它是一种函数型编程,完全地展现了“分而治之”的哲学思想,是分布式系统下一种强有力的处理工具。

因而,用户编写mapreduce程序时,一方面要具备mapreduce程序思想;另一方面要符合mapreduce程序开发流程。同时,通过多写mapreduce程序,掌握并熟悉这种编程模型。

Resource:

1  http://www.wangluqing.com/2014/03/hadoop-mapreduce-develop-flow/