Я играю с Spark. Я пробовал функцию SortBy в искре с некоторыми образцами данныхКак сортировать более одного значения в pyspark
tmp = [('e', 1), ('b', 2), ('1', 3), ('d', 4), ('2', 5),('a',1)]
sc.parallelize(tmp).sortBy(lambda (x,y): y).collect()
Это прекрасно работает и сортирует целое значение в ключевых парах значений. Что требуется для сортировки в соответствии с ключом после сортировки по целому числу?
sc.parallelize(tmp).sortBy(lambda (x,y): y,x).collect()
говорит, что x не определен.
Желаемая выход
('a', 1),('e',1) ('b', 2), ('1', 3), ('d', 4), ('2', 5)
да, что сделал трюк. Пожалуйста, укажите это как ответ – mhn