2010-10-22 8 views
1

Я новичок Hadoop. Мне удалось успешно запустить пример WordCount.Пример Hadoop WordCount - Реализация Сортировка

Я хотел бы изменить этот пример таким образом, чтобы мой результат сортировался в порядке возрастания количества. Я не могу понять, где мне нужно будет внести необходимые изменения.

Было бы здорово, если бы кто-то дал мне какое-то направление для осуществления сортировки?

ответ

0

См org.apache.hadoop.examples.Sort

Это не супер-просто сделать с помощью карты/уменьшить. Это включает в себя получение гистограммы ваших данных и использование TotalOrderPartitioner.

В качестве альтернативы вы можете использовать Hive или Pig, которые имеют встроенные функции для сортировки.

+0

Спасибо! Я посмотрел на Hive, и это похоже на потенциальное решение. – user330973

Смежные вопросы