首页 > 代码库 > Spark API编程动手实战-03-以在Spark 1.2版本实现对Job输出结果进行排序

Spark API编程动手实战-03-以在Spark 1.2版本实现对Job输出结果进行排序

从前一篇文章中的wordcount的输出结果可以看出来结果是未经排序的,如何对spark的输出结果进行排序呢?

技术分享

先对reduceByKey的结果进行key,value位置置换(数字,字符),然后再进行数字排序,再将key,value位置置换后就是排序后的结果了,最终将结果存储到HDFS中

技术分享

技术分享


技术分享


技术分享


可以发现我们成功对输出结果进行排序!

Spark API编程动手实战-03-以在Spark 1.2版本实现对Job输出结果进行排序