Я очень стараюсь это решить, но я не могу понять, как читать zipped .csv-файлы в R. Я мог сначала разархивировать файлы, а затем прочитать их, но поскольку количество распакованных данных составляет около 22 ГБ, я думаю, что более практично обрабатывать сжатые файлы.Прочтите zipped .csv-файл в R
У меня в основном есть много файлов .csv, которые я ZIPPED ONE BY ONE в одиночные .7z файлы. Каждый файл называется как: file1.csv
, file2.csv
и т.д., которые пронеслись стали соответственно: file1.csv.7z
, file2.csv.7z
и т.д.
Если я использую следующую команду:
data <- read.table(unz("substn-20100101.csv.7z", "substn-20100101.csv"), nrows=10, header=T, quote="\"", sep=",")
Я получаю сообщение:
Error in open.connection(file, "rt") : cannot open the connection
In addition: Warning message:
In open.connection(file, "rt") : cannot open zip file 'substn-20100101.7z'
Любая помощь будет очень признательна, заблаговременно.
Это сообщение может быть уместным - http://stackoverflow.com/questions/3053833/using-r-to-download-zipped-data-file-extract-and-import-data – zx8754
Вы правильно настроили свой рабочий каталог ? Ваш файл данных должен быть там. https://sites.google.com/site/manabusakamoto/home/r-tutorials/r-tutorial-4 – JosefAssad
Привет, оба! @ zx8754: Спасибо, я уже видел сообщение, но я получаю следующую ошибку: Ошибка в open.connection (файл, «rt»): не удается открыть соединение Кроме того: Предупреждение: В открытом .connection (файл, «КТ»): не может открыть почтовый файл «substn-20100101.7z: C» @ Йозеф Асад: да, я использую следующий код, чтобы установить рабочий каталог и он всегда работал: гт (список = Ls (все = TRUE)) Sys.setlocale ("LC_TIME", "C") # Windows гт (список = Ls()) main_dir <- «C:/Users /.../ Forecast-Machine Learning " setwd (main_dir) температура <- TempFile() данные <- read.table (ипг ("substn-20100101.7z", темп)) Unlink (темп) – bosspe