首页 > 代码库 > hadoop学习笔记

hadoop学习笔记

map函数执行结束后,map输出的<k, v>一共有4个,分别是<hello, 1><you, 1>,<hello, 1>,<me, 1>
分区,默认只有一个分区
排序 <hello, 1>,<hello, 1>,<me, 1><you, 1>
分组 把相同key的value放到一个集合中 <hello, {1,1}><me, {1}><you, {1}>,每一组调用一次reduce函数
归约(可选)

map任务输出的临时结果存放在linux磁盘上。

hadoop学习笔记