Как извлечь атрибут href из этого кода с помощью XPath?XPath - атрибут extract
<a
itemprop="url"
name="1055782959"
href=“abc123”>
<span itemprop="name">myName</span>
</a>
EDIT: Немного больше информации о том, что я пытаюсь сделать. я на самом деле хочу усиков некоторые данные с веб-сайта с помощью R. Я попытался следующие, но это не работает:
xpathSApply(doc,"a/@href",xmlValue)
документ страница HTML.
EDIT: код, чтобы получить веб-страницу:
fileUrl <- "http://www.gumtree.com.au/s-cars-vans-utes/toyota/page-1/k0c18320"
#doc <- htmlTreeParse(fileUrl, useInternal=T)
getLinks <- function() {
links <- character()
list(a = function(node, ...) {
links <<- c(links, xmlGetAttr(node, "href"))
node
},
links = function()links)
}
h1 <- getLinks
doc <- htmlTreeParse(fileUrl, useInternal = TRUE, handlers = h1);
h1$links()
Использование 'а/@ href' – JLRishe
' xpathSApply (xmlInternalTreeParse (DOC) "// а", xmlGetAttr, "HREF") ' – thelatemail
@thelatemail это одно дает мне сообщение об ошибке: Ошибка в as.vector (x, "character"): не может принуждать тип 'externalptr' к вектору типа 'character'. Но этот код, похоже, немного сработал. Он дает мне все URL-адреса: xpathSApply (doc, "// a", xmlGetAttr, "href"). – user2343837