2012-02-10 1 views
1

Я верю (поверь?) Я понимаю, как вторичный сорт работает в Hadoop. Я создал промежуточный ключ, состоящий из 4 полей. Я разделяю первое поле, группируюсь по первому и второму, и сортирую по всем 4.Любые советы по отладке проблем со вторичной сортировкой в ​​Hadoop MapReduce?

Похоже, я собрал и разбил на разделы, но значения попадают в редуктор не по порядку.

Любые идеи относительно подхода к отладке этого?

ответ

0

На данный момент кажется, что просмотр статического кода вручную или с использованием инструментов работает хорошо. Я считаю, что я нарушил правило: при переопределении compareTo(), не забудьте переопределить equals() и hashCode(). Я буду держать все в курсе, если это решит проблему.

+0

Никто не придумал альтернативные предложения в выходные, поэтому я принимаю свой собственный ответ. – Olaf

Смежные вопросы