2013-05-01 1 views
1

Я использую редуктор карты на Hadoop на Elastic Map Reduce (на AWS), но он сортирует его как строку, я хочу сделать целочисленную сортировку. Как это сделать ? Я хочу взять ключ как целое и выполнить целую сортировку по ключу.Force integer sort в Hadoop на Elastic Map Reduce (AWS)

ответ

2

Я рекомендую предварительно отложить (или отложить) целое число с ведущими нулями, чтобы вы могли использовать Hadoop (или EMR) для лексической сортировки. Hadoop не поддерживает сортировку по целочисленным параметрам - это просто лексическая сортировка.

Например, если эти ключи:

1 
15 
168 
1900 

Выведите их, как это в вашем картографа:

0001 
0015 
0168 
1900 

так, что Hadoop может правильно сортировать их.

Смежные вопросы