Вот код, я бегуRvest ошибки выскабливание
library(rvest)
rootUri <- "https://github.com/rails/rails/pull/"
PR <- as.list(c(100, 200, 300))
list <- paste0(rootUri, PR)
messages <- lapply(list, function(l) {
html(l)
})
До этого момента он, кажется, работает хорошо, но когда я пытаюсь извлечь текст:
html_text(messages)
я получаю:
Error in xml_apply(x, XML::xmlValue, ..., .type = character(1)) :
Unknown input of class: list
Попытка извлечь конкретный элемент:
html_text(messages[1])
Не можете сделать это либо ...
Error in xml_apply(x, XML::xmlValue, ..., .type = character(1)) :
Unknown input of class: list
Так что попробуйте другой способ:
html_text(messages[[1]])
Это, кажется, по крайней мере, получить на данные, но до сих пор не успешным :
Error in UseMethod("xmlValue") :
no applicable method for 'xmlValue' applied to an object of class "c('HTMLInternalDocument', 'HTMLInternalDocument', 'XMLInternalDocument', 'XMLAbstractDocument')"
Как извлечь текстовый материал из каждого элемента моего списка?
Почему вы не используете API GitHub? У него есть глаголы для [pull request] (https://developer.github.com/v3/pulls/). – hrbrmstr
API github делит комментарии на несколько категорий (проблемы, запросы на перенос, коммит), что означает, что мне приходится писать относительный сложный запрос. В Интернете у меня есть все, что централизовано на одной странице. – histelheim