Комментарий Panagiotis для использования download.file()
, как правило, хороший совет, но я не мог заставить его работать здесь (и было бы интересно узнать, почему). Вместо этого я использовал httr
.
(Edit: получил его, я отменил арг из download.file()
... Повторяй за мной: всегда использовать именованные арг ...)
Другая проблема с этими данными: оказывается не быть регулярным xls
файла, Я не мог открыть его с еще отличным пакетом readxl
. Похоже, что вкладка разделена плоским файлом, но не имеет успеха с read.table()
. readr::read_delim()
сделал.
library(httr)
library(readr)
r <- GET("https://clients.rte-france.com/servlets/IndispoProdServlet?annee=2017")
# Write the archive on disk
writeBin(r$content, "./data/rte_data")
rte_data <-
read_delim(
unzip("./data/rte_data", exdir = "./data/"),
delim = "\t",
locale = locale(encoding = "ISO-8859-1"),
col_names = TRUE
)
Все еще существуют проблемы с синтаксическим разбором, но не уверены, что их следует решать в этом вопросе SO.
Поиск файла [download.file] (https://stat.ethz.ch/R-manual/R-devel/library/utils/html/download.file.html). Существует несколько десятков вопросов о загрузке. Просто убедитесь, что вы используете 'wb' (двоичный) в качестве режима загрузки –
Спасибо. Мне удалось загрузить файл download.file ("https://clients.rte-france.com/servlets/IndispoProdServlet?annee=2017", dest = "dataset.zip", mode = "wb") unzip ("набор данных. zip ")". Проблема в том, что это формат Excel 97, и я не могу прочитать его в R с регулярным readxl. – oana