Я использую Nutch для сканирования веб-сайта и в настоящее время написания плагина. Jaunt 1.0.0.1 используется для анализа HTML. Например, у меня есть рядJaunt - проверьте, есть ли определенный элемент
Element infoBooksItem = body.findFirst("<div class=info_books_item>");
который получает и ошибок, когда на странице не <div class=info_books_item>
. В настоящее время я смотрю Jaunt JavaDocs, но не могу понять, как проверить, есть ли такой элемент или нет.