Я работаю WTH кортежей Python и есть текстовый файл, который выглядит какMapReduce Сортировать по Python кортежей Численно
(1,value1)
(2,value2)
(3,value3)
...
(100,value100)
Как я могу настроить свою работу MapReduce для сортировки по первому ключу в кортеже как целое ?
Моя задача сокращения должна выводить отсортированный список кортежей, поэтому я не хочу начинать заменять скобки и запятые вкладками. Это будет боль, чтобы перевести обратно в кортежи.
Я бег моего Hadoop задания из баша со следующими параметрами:
hadoop jar /usr/local/Cellar/hadoop/2.*/libexec/share/hadoop/tools/lib/hadoop-streaming-2*.jar
-D mapreduce.job.output.key.comparator.class=org.apache.hadoop.mapred.lib.KeyFieldBasedComparator
-D mapreduce.partition.keycomparator.options=-n
-reducer reducer.py
-input tuples.txt
-output sortedtuples
Благодарность
Вы можете запускать задания по уменьшению размера карты в миллионах способов в python. Как вы управляете своим? Это пи-искра? – gnicholas
добавлено больше информации. просмотреть отредактированный вопрос – Jack