首页 > 代码库 > mr编程快捷键活用技巧详解

mr编程快捷键活用技巧详解

  1、Shift + Alt + S

  技术分享

  技术分享

  技术分享

  技术分享

  技术分享

  Hadoop没有使用jdk自带的默认序列化机制。

  现在呢,hadoop-2.*里有两套序列化机制。一个是自己hadoop的序列化机制,一个是谷歌的。

  所以,要改为。。

  技术分享

  技术分享

  技术分享

 

 *********=======> reduce

  技术分享

  技术分享

  技术分享

  技术分享

  技术分享

  把前面一大串,去掉,就不出错了。因为接口里没这样写全。

   技术分享

  为什么v2s是集合,因为。它是一个迭代器,你看。迭代器里,前面,放的是什么类型,后面,迭代的是谁。

  技术分享

   

   *********=======>Job

  把mapreduce作业,抽象成job对象。然而,到此步,现在,我们需要提交mapreduce作业,那么,以后,我们提交job对象就可以了是吧。但是,我们有没有我们自定义的map和reduce啊。没有很明显。那么我们需要组装起来,才可以达到目的。

  所以,就有了如下等代码的存在。先后顺序没关系,Map相当于搬砖,reduce相当于砌墙。

   技术分享

    到此,我已经把mapreduce作业,抽象成job对象,自定的map和自定义的reduce,组装起来了。最后一行是作业的属性,True,是在执行的过程中,打印进度和详情。

 ======》  若是在eclipse或myeclipse里,插入了插件(自行还需要配置),就可以不需指明在哪个hadoop集群下了。

      

mr编程快捷键活用技巧详解