Обычно в PHP я просто разбирал старый документ и записывал в новый документ, игнорируя нежелательные элементы.Как удалить элементы страницы в htmlunit
ответ
Посмотрите на методы DOM, вы можете удалить узлы.
http://htmlunit.sourceforge.net/apidocs/com/gargoylesoftware/htmlunit/html/DomNode.html
Спасибо, Ахмед, я ценю ваш комментарий. У меня уже было решение (см. Ниже), но ваш комментарий заставил меня подумать, что, может быть, я смогу найти более простое решение из документов HtmlUnit API. –
К сожалению, мой ответ был выше. Извините, новичок здесь. –
Это было первое решение, которое я придумал:
DocumentBuilder builder = DocumentBuilderFactory
.newInstance()
.newDocumentBuilder();
StringReader reader = new StringReader(xml);
Document document = builder.parse(new InputSource(reader));
XPathExpression expr = XPathFactory
.newInstance()
.newXPath()
.compile(...);
Object result = expr.evaluate(document, XPathConstants.NODESET);
Element el = document.getDocumentElement();
NodeList nodes = (NodeList) result;
for (int i = 0; i < nodes.getLength(); i++) {
el.removeChild(nodes.item(i));
}
Как вы можете видеть, что это своего рода долго. Будучи кодировщик, который стремится к простоте, я решил последовать совету Ахмеда надеясь, что я буду найти лучшее решение, и я пришел с этим:
List<?> elements = page.getByXPath(...);
DomNode node = null;
for(Object o : elements) {
node = (DomNode)o;
node.getParentNode().removeChild(node);
}
Пожалуйста, обратите внимание, это только фрагменты, я пропустил импорт и XPath но вы получите эту идею.
- 1. HtmlUnit получает ошибку страницы
- 2. HTMLUnit удалить журналы
- 3. HtmlUnit комментирует строки страницы facebook
- 4. Faster обработки страницы с HtmlUnit
- 5. Код статуса веб-страницы HtmlUnit
- 6. Срыв данных с веб-страницы. Java, HTMLUnit
- 7. HtmlUnit: загрузить элементы на странице AJAX
- 8. Скрап с HtmlUnit в Java (Как найти элементы)
- 9. HtmlUnit: как искать текст
- 10. Получить ресурсы страницы с помощью HtmlUnit
- 11. Загружает ли HtmlUnit изображения при просмотре страницы?
- 12. HTMLUnit в Java - Как перейти на страницы GridView
- 13. Как использовать htmlunit для прокрутки страницы в facebook
- 14. Как вставить содержимое в iframe HTML-страницы с помощью HTMLUnit?
- 15. Как выполнить JavaScript в HtmlUnit без запуска страницы скриптов
- 16. Ошибка HtmlUnit при попытке подключения веб-страницы
- 17. HtmlUnit Ошибка Javascript при получении страницы
- 18. Как удалить элементы страницы из перемещений с помощью браузера?
- 19. Как удалить элементы в массиве?
- 20. Как удалить элементы из массива?
- 21. Как удалить элементы
- 22. Как удалить элементы html?
- 23. Как удалить клонированные элементы
- 24. Как удалить элементы списка?
- 25. Как удалить элементы NSDictionary
- 26. Как удалить элементы?
- 27. Как удалить элементы массива?
- 28. Как удалить элементы ComboViewer?
- 29. Как удалить эти элементы?
- 30. Как загрузить Html-контент/источник веб-страницы с помощью HtmlUnit
ok .. и ......? – bragboy
Я не могу понять, как это сделать, используя классы htmlunit. Ну, я могу, но это, вероятно, займет несколько дней. Поэтому все, что вы можете дать мне за советом, будет очень признателен. –