Любые советы по отладке проблем со вторичной сортировкой в Hadoop MapReduce?

Я верю (поверь?) Я понимаю, как вторичный сорт работает в Hadoop. Я создал промежуточный ключ, состоящий из 4 полей. Я разделяю первое поле, группируюсь по первому и второму, и сортирую по всем 4.Любые советы по отладке проблем со вторичной сортировкой в Hadoop MapReduce?

Похоже, я собрал и разбил на разделы, но значения попадают в редуктор не по порядку.

Любые идеи относительно подхода к отладке этого?

источник

2012-02-10 Olaf

На данный момент кажется, что просмотр статического кода вручную или с использованием инструментов работает хорошо. Я считаю, что я нарушил правило: при переопределении compareTo(), не забудьте переопределить equals() и hashCode(). Я буду держать все в курсе, если это решит проблему.

источник

2012-02-10 16:28:22 Olaf

Никто не придумал альтернативные предложения в выходные, поэтому я принимаю свой собственный ответ. – Olaf

Любые советы по отладке проблем со вторичной сортировкой в ​​Hadoop MapReduce?

ответ

Смежные вопросы

Любые советы по отладке проблем со вторичной сортировкой в Hadoop MapReduce?