Я хочу получить список значений из HTML-документа. Я использую HTMLUnit.Получить содержимое списка элементов span с помощью HTMLUnit и XPath
Существует много элементов span с классом. Я хочу, чтобы извлечь содержимое в теги пролетных:
<span class="topic">
<a href="http://website.com/page/2342" class="id-24223 topic-link J_onClick topic-info-hover">Lean Startup</a>
</span>
Мой код выглядит следующим образом:
List<?> topics = (List)page.getByXPath("//span[@class='topic']/text()");
Однако всякий раз, когда я пытаюсь пройти по списку я получаю NoSuchElementException
. Может ли кто-нибудь увидеть очевидную ошибку? Также будут оценены ссылки на хорошие учебные пособия.
могли бы вы добавить строку, которая приходит ошибка с? Удаление текста() из xpath и использование HtmlElement.getTextContent() - лучшее и безопасное решение. –