2013-10-26 4 views
0

Пусть у меня есть два набора данных:По умолчанию класс Mapper-Reducer

hello world 
bye world 

и

hello earth 
new earth 

, и я хочу, чтобы запустить карту, уменьшить задачу, которая не определяет класс сопоставителя или класс редуктора, так будет вызываться сборщик по умолчанию и редуктор, которые оба являются функциями идентичности. Когда я запускаю работу, выход:

0  hello world 
0  hello earth 
12  new earth 
12  bye world 

Я смущен, почему ключ такой, как 0 и 12?! Я просто использовал картограф по умолчанию и редуктор, как я заметил эти строки в main() ::

// job.setMapperClass(Map.class); 
// job.setCombinerClass(Reduce.class); 
// job.setReducerClass(Reduce.class); 

Итак, мой вопрос: что является ключ выхода здесь? почему это выглядит как 0, 0, 12, 12?

ответ

2

0,0,12 и 12 являются смещениями файлов во входных данных. В случае текстовых входов K в mapper - это смещение файла, а значение - строка ввода. Проверьте this для получения дополнительной информации.

Смежные вопросы