Я верю (поверь?) Я понимаю, как вторичный сорт работает в Hadoop. Я создал промежуточный ключ, состоящий из 4 полей. Я разделяю первое поле, группируюсь по первому и второму, и сортирую по всем 4.Любые советы по отладке проблем со вторичной сортировкой в Hadoop MapReduce?
Похоже, я собрал и разбил на разделы, но значения попадают в редуктор не по порядку.
Любые идеи относительно подхода к отладке этого?
Никто не придумал альтернативные предложения в выходные, поэтому я принимаю свой собственный ответ. – Olaf