2014-09-15 2 views
-2

Добрый день,Сортировка нескольких URL-адресов в R с использованием sapply

Спасибо, что помогли мне решить этот вопрос.

У меня есть список нескольких URL-адресов, которые мне интересны для очистки определенного поля.

На данный момент я использую функцию ниже, чтобы вернуть значение я заинтересован в течение определенного поля:

dayViews <- function (url) { 
    raw <- readLines(url) 
    dat <- fromJSON(raw) 
    daily <- dat$daily_views$`2014-08-14` 
    return(daily) 
} 

Как изменить это запустить в списке нескольких URL-адресов? Я попытался с помощью sapply/lapply над списком URL-адресов, но это дает мне следующее сообщение:

"Error in file(con, "r") : invalid 'description' argument" 

Если у кого есть какие-либо предложения, я бы очень благодарен.

Большое спасибо,

+3

Пожалуйста, включите ваш код для sapply. И уверены ли вы, что весь вектор URL-адресов сбрасывается без ошибок? При очистке вы должны использовать 'try' либерально. –

ответ

0

Делая какие-нибудь подобное для вас, @yarbaur, я прочитал в R электронной таблицы, сохраняет все URL-адреса из набора Я хочу, чтобы очистить. У него есть столбцы для компании, URL и XPath. Затем попробуйте что-то вроде этого кода, где я заменил имена переменных, которые я составил. Однако я не использую сайты JSON:

temp <- apply(yourspreadsheetReadintoR, 1, 
       function(x) { 
       yourCompanyName <- x[1] 
       yourURLS <- x[2] 
       yourxpath <- x[3] # I also store the XPath expressions for each site 

       fetch <- content(GET(yourURLS)) 
       locs <- sapply(getNodeSet(fetch, yourxpath), xmlValue) 

       data.frame(coName=rep(yourCompanyName, length(locs)), location=locs) 
       }) 
Смежные вопросы