2017-02-04 3 views
1

В проекте java, я должен использовать HtmlUnit для извлечения содержимого веб-страницы.HtmlUnit: как искать текст

Как найти элемент, который содержит содержимое 123. Он является частью html-документа. Направляющий элемент не имеет идентификатор, класс или имя:

.... 
    <tr> 
    <td>123</td> 
    <td>456</td> 
    </tr> 
.... 

Это не представляется возможным преобразовать весь документ в текст и искать потом.

ответ

3

Вам необходимо составить соответствующее выражение xpath. В вашем случае это может быть:

//*[text()='123'] 

или в более общем

//*[contains(text(),'123')] 

Чтобы найти элементы: page.getByXPath("//*[contains(text(),'123')]")