Я хочу пройти все дочерние узлы на странице html. например, <body>......</body>
будет иметь множество дочерних тегов. Я хочу, чтобы эти теги проходили рекурсивно, так что ни один из тегов не остается открытым. Затем я хочу получить текст из каждого тега. Я ищу общее решение, которое будет работать на любой веб-странице с любой структурой, которую она может иметь. Может ли кто-нибудь это предложить? СпасибоКак я могу пройти все дочерние элементы всех тегов, чтобы получить данные, используя lxml в python?
Q
Как я могу пройти все дочерние элементы всех тегов, чтобы получить данные, используя lxml в python?
0
A
ответ
0
yes, python beautiful soap - отличная библиотека python с множеством функций для этого.
+0
Спасибо, но я ищу решение при использовании lxml – Kaggler
Смежные вопросы
- 1. Как пройти все дочерние элементы программы
- 2. Получить все элементы HTML, используя LXML
- 3. Как получить некоторые дочерние элементы с использованием python и lxml
- 4. Как я могу получить все дочерние элементы для родительского контейнера?
- 5. Как я могу захватить все дочерние элементы в XML?
- 6. Как я могу получить все дочерние элементы строки таблицы и динамически изменять данные?
- 7. Как я могу экспортировать все дочерние элементы в пакете Perl?
- 8. Получить все дочерние элементы LinearLayout
- 9. Получить все дочерние элементы в списке LINQ
- 10. Как получить все дочерние элементы ввода
- 11. Как получить дочерние элементы, используя NightwatchJs
- 12. Как я могу пройти через все узлы во всех путях?
- 13. Python tkinter - как удалить все дочерние элементы?
- 14. Могу ли я переопределить дочерние элементы, используя базовый класс?
- 15. XSLT: Используя карту, чтобы изменить дочерние элементы
- 16. Как пройти через $ _GET, чтобы получить все данные
- 17. C# | Как получить все дочерние элементы ToolStrip?
- 18. Как я могу запросить все дочерние элементы Winform рекурсивно?
- 19. LINQ запрос, чтобы получить все дочерние элементы, передавая идентификатор родительского
- 20. Как получить все дочерние элементы родительского контейнера в extjs
- 21. python [lxml] - очистка html-тегов
- 22. Django получить все дочерние дочерние модели, используя django queryset
- 23. получить все ссылки HTML, используя lxml
- 24. Получить все дочерние элементы своим родителем
- 25. Запрос Чтобы получить все дочерние и дочерние дочерние элементы заданного корня
- 26. Как я могу выделить дочерние элементы StackPanel?
- 27. Как получить дочерние элементы
- 28. Как получить все дочерние элементы родительского элемента XML в C#
- 29. Как я могу получить дочерние элементы (SubKeys) раздела реестра?
- 30. Python удаляет все дочерние элементы, кроме одного
ect 1)
// некоторый текст//some text