0
Я использую пакет XML R. После извлечения кода XML в объекте «документ» с кодом:Извлечь часть строки с пакетом XML
doc = htmlParse(html, asText=TRUE),
Представьте себе, что у меня есть просто этот XML-код в «документ»:
<p> interesting <a> not interesting </a> interesting2 </p>
Я хочу, чтобы извлечь только «интересно 'часть (т.е. все, кроме' a ').
Я попытался выражения похожести на:
interesting <- xpathSApply(doc, "//p", xmlValue)
, который, очевидно, извлечь все содержимое док. Как я могу извлечь только интересующую меня строку текста (т. Е. «Интересно интересно2»).
Благодарим вас заранее!
Благодаря waterling! Пожалуйста, смотрите ниже! – JesusB