2017-02-06 4 views
0

Я использую пакет XML R. После извлечения кода XML в объекте «документ» с кодом:Извлечь часть строки с пакетом XML

doc = htmlParse(html, asText=TRUE), 

Представьте себе, что у меня есть просто этот XML-код в «документ»:

<p> interesting <a> not interesting </a> interesting2 </p> 

Я хочу, чтобы извлечь только «интересно 'часть (т.е. все, кроме' a ').

Я попытался выражения похожести на:

interesting <- xpathSApply(doc, "//p", xmlValue) 

, который, очевидно, извлечь все содержимое док. Как я могу извлечь только интересующую меня строку текста (т. Е. «Интересно интересно2»).

Благодарим вас заранее!

ответ

0

//*[not(self::a)]/text() исключит a

+0

Благодаря waterling! Пожалуйста, смотрите ниже! – JesusB

Смежные вопросы