2016-11-24 9 views
0

Я хочу знать, как мы можем преобразовать файл .xlsx, находящийся в hdfs, в CSV-файл, используя R-скрипт.Преобразование файла xlsx в файл csv в R, когда файл xlsx присутствует в hdfs

Я попытался использовать пакеты XLConnect и xlsx, но это дало мне ошибку «файл не найден». Я предоставляю местоположение HDFS в качестве входного файла в R-скрипте, используя вышеуказанные пакеты. Я могу читать CSV-файлы из hdfs, используя R script (read.csv()).

Нужно ли устанавливать новые пакеты для чтения .xlsx в hdf.

обмена код я использовал:

library(XLConnect) 

d1=readWorksheetFromFile(file='hadoop fs -cat hdfs://............../filename.xlsx', sheet=1) 

"Error: FileNotFoundException (Java): File 'filename.xlsx' could not be found - you may specify to automatically create the file if not existing."

Я уверен, что файл присутствует в указанном месте.

Надеюсь, мой вопрос ясен. Пожалуйста, предложите метод его решения.

Спасибо заранее!

+1

Добро пожаловать в StackOverflow! Пожалуйста, прочитайте информацию о [как задать хороший вопрос] (http://stackoverflow.com/help/how-to-ask) и как дать [воспроизводимый пример] (http://stackoverflow.com/questions/ 5963269). Это облегчит вам помощь другим людям. – Jaap

+0

Ошибка ясна. Вы не имеете в виду файл в правильном порядке. –

ответ

0

hadoop fs не является файлом, а командой, которая копирует файл с HDFS в локальную файловую систему. Запустите эту команду извне R (или из нее, используя system), а затем откройте электронную таблицу.

Смежные вопросы