首页 > 代码库 > Hadoop之MapReduce程序开发流程
Hadoop之MapReduce程序开发流程
摘要:MapReduce程序开发流程遵循算法思路、Mapper、Reducer、作业执行的步骤。
关键词:MapReduce 程序 开发流程
对于一个数据处理问题,若需要MapReduce,那么如何设计和实现?MapReduce程序基础模板,包含两个部分,一个是map,一个是reduce。map和reduce的设计取决解决问题的算法思路;而map和reduce的执行需要作业的调度。
因此,MapReduce程序开发可以遵循以下流程。
第一步:清楚问题是什么,确定解决问题的算法思路。
第二步:设计和实现mapreduce程序中的Mapper。
第三步:设计和实现mapreduce程序中的Reducer。
第四步:设置作业调度。
mapreduce程序与很多编程有所不同,它是一种函数型编程,完全地展现了“分而治之”的哲学思想,是分布式系统下一种强有力的处理工具。
因而,用户编写mapreduce程序时,一方面要具备mapreduce程序思想;另一方面要符合mapreduce程序开发流程。同时,通过多写mapreduce程序,掌握并熟悉这种编程模型。
Resource:
1 http://www.wangluqing.com/2014/03/hadoop-mapreduce-develop-flow/
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。