36 MAPREDUCE自定义GroupingComparator

36 MAPREDUCE自定义GroupingComparator

需求有如下订单数据:现在需要求出每一个订单中成交金额最大的一笔交易。分析1、利用“订单id和成交金额”作为key,可以将map阶段读取到的所有订单数据按照id分区,按照金额排序,发送到reduce。2、在reduce端利用groupingcomparator将订单id相同的kv聚合成组,然后取第一个...

Hadoop MapReduce工作详细流程(Partitioner/SortComparator/GroupingComparator)

转自:http://blog.sina.com.cn/s/blog_7581a4c30102veem.html map阶段 1. 使用job.setInputFormatClass(TextInputFormat)做为输入格式。注意输出应该符合自定义Map中定义的输出。 2. 进入Mapper的ma...

Hadoop 分布式计算框架 MapReduce

89 课时 |
745 人已学 |
免费
开发者课程背景图

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐