Метод искры saveAsTextFile
, который может хранить RDD[T]
на диск или hdfs легко.Как загрузить данные из сохраненного файла с помощью Spark
T - произвольный сериализуемый класс.
Я хочу изменить операцию. Интересно, есть ли loadFromTextFile
, который может легко загрузить файл в RDD[T]
?
Позвольте мне сделать это ясно:
class A extends Serializable {
...
}
val path:String = "hdfs..."
val d1:RDD[A] = create_A
d1.saveAsTextFile(path)
val d2:RDD[A] = a_load_function(path) // this is the function I want
//d2 should be the same as d1
Но он генерирует RDD [String], мне нужно РДД [T]. – worldterminator
Я думаю, что Spark по умолчанию не поддерживает это. Но вы можете преобразовать исходный RDD в определенный тип. Я обновляю свой ответ. Пожалуйста, подтвердите. – Ramana