2015-08-01 4 views
0

Я пытаюсь получить Xpath из следующего. Я пытаюсь получить имя местоположения. «Лондон» из этого тега div. Я использую \ h4 \ a как Xpath, но я не могу этого сделать. Любые предложения о том, как указать правильный Xpath?Xpath найти в html-коде

<h4><a href="www.example.com" tile="Click here">London</a></h4> 
+0

может быть, это будет // h4/а? :) –

+0

Вы используете определенный язык? – hwnd

+0

Я использую R, и он имеет функциональность для xpath. – user3570187

ответ

1

Вы можете использовать XML пакет, применяя XPath, чтобы захватить текст из этого узла.

library(XML) 
res <- xpathSApply(htmlParse(doc), '//h4/a', xmlValue) 

Или сокращенная версия:

res <- doc['//h4/a/text()'][[1]] 
Смежные вопросы