Я просмотрел документацию sqoop и не нашел информацию о том, почему в sqoop-1 нет фазы редуктора. Может кто-то объяснит это.Фаза редуктора Apache Sqoop-1
ответ
Целью Редуктора является объединение входных значений и возврат одного выходного значения.
Посмотрите на простой пример WordCount в MapReduce. Редуктор используется для агрегирования числа вхождений одного слова.
Поскольку характер задания Sqoop заключается в извлечении входных записей из данной РСУБД и поместить записи в данный выходной каталог в HDFS или в таблицу Hive, задание не требует какой-либо агрегации и, следовательно, необходим.
Уменьшение фазы не требуется, когда все задачи могут выполняться параллельно.
Sqoop не нуждается в редукторе, поскольку он импортирует/экспортирует данные между РСУБД и файловой системой HDFS (или таблицами Hive.).
Поскольку РСУБД состоит из структурированных данных, нет необходимости в тасовании или сортировке, а агрегация может быть выполнена в самом устройстве.