У меня есть RDD, который создается с помощью Spark. Теперь, если я напишу этот RDD в файл csv, мне предоставляются некоторые методы, такие как «saveAsTextFile()», который выводит CSV-файл на HDFS.Сохраните искру RDD в локальной файловой системе с помощью Java
Я хочу записать файл в свою локальную файловую систему, чтобы мой процесс SSIS мог выбирать файлы из системы и загружать их в БД.
В настоящее время я не могу использовать sqoop.
Возможно ли это где-то в Java, кроме написания сценариев оболочки для этого.
Требуется любая ясность, пожалуйста, сообщите об этом.
Не уверен ни в одном методе Spark для этого. Но вы всегда можете открыть файл outoutstream, перебрать RDD и сохранить его в файле. Простой старый путь! –
Эй, какой путь вы используете в методе saveAsTextFile()? вы можете предоставить некоторый фрагмент кода .. –
Я пробовал следующие пути: - "hdfs: // hadoop/bigdata /" Это сохраняет файл в hdfs - Кроме того, попытался с этим, когда я скопировал абсолютный путь к файлу "/ kanav/выход /». Это возвращается без ошибок, но также не создает никакого файла. –