У меня есть файл, который содержит имена в каждой строке, я хочу добавить числа последовательно в каждую строку. Для, например, если файл как этотSpark cluster Добавление числа в каждую строку в файле
a
b
c
d
Я хочу, чтобы достичь этого
a,1
b,2
c,3
d,4
меня написать этот код, чтобы достичь этой
val lines = sc.textFile("data.txt")
val pair = lines.zipWithIndex().map{case(i,line) => i.toString +","+line}
pair.collect()
Но, как вы знаете, Спарк распределяет его по различным кластерам. Поэтому я не уверен, что это сработает. Кто-нибудь может рассказать мне, как я могу это достичь? Заранее спасибо.
какова связь между данными и номер строки –
в файле data.txt «а» в первой строке, «В» во второй строке. Поэтому в основном я добавляю номер строки – gashu
У вас возникли проблемы с 'zipWithIndex'? Он должен работать так, как вы ожидаете, даже задачи распределены между узлами. – Mariusz