MapReduce工作原理
上一节
下一节
4.2 MapReduce工作原理
4.2.1 MapReduce工作过程

4.2.2 MapTask工作原理
MapTask作为MapReduce工作流程前半部分,它主要经历5个阶段,分别是Read阶段、Map阶段、Collect阶段、Spill阶段和Combiner阶段。

4.2.3 ReduceTask工作原理
ReduceTask的工作过程主要经历了5个阶段,分别是Copy阶段、Merge阶段、Sort阶段、Reduce阶段和Write阶段。

4.2.4 Shuffle工作原理
Shuffle是MapReduce的核心,它用来确保每个reducer的输入都是按键排序的。它的性能高低直接决定了整个MapReduce程序的性能高低,map和reduce阶段都涉及到了shuffle机制。


