В моем редукторе мне требуется общее количество «строк» ввода, которые были обработаны картографами. входПолучить количество записей ввода в редукторе Hadoop
образца:
- линия, 1, оф, вход
- линия, 2, из, вход
- линия, 3, оф, вход
Так, во всех Редукторов, мне нужно иметь доступ ко всему, что испускалось Mappers плюс общее количество строк (в данном случае 3).
Я предполагаю, что мне понадобится либо несколько заданий, либо цепь вместе с некоторыми преобразователями и/или редукторами, но я не уверен в правильном пути.
Примечание: Это не простая средняя программа, поэтому я не могу просто иметь один ключ от устройства отображения.
Спасибо, это похоже на то, что мне нужно. –