Я работаю над проектом, и меня интересует только макет страницы, а не текст. В настоящее время у меня проблемы с удалением каждого элемента на уровне текста. например:Как удалить все элементы на уровне текста с помощью Jsoup?
<div>
<ul>
<li>some menu item</li>
<li>some menu item</li>
<li>some menu item</li>
</ul>
</div>
<div>
<h3>Tile of some text</h3>
<p></p>
<p>some text</p>
<ul>
<li>some other text</li>
<li>some other text</li>
<li>some other text</li>
</ul>
</div>
Я хочу, чтобы избавиться от уль, Li, р и h3 элементов на уровне текста, но сохранить DIV и список с пунктами меню, так как это является частью макета страницы , Как мне это сделать с Jsoup?
Я пытался сделать это с помощью document.select(), а затем .remove() элементов, но функция выбора не создана для таких нестандартных запросов.
EDIT: Конечный результат я хочу получить это:
<div>
<ul>
<li>some menu item</li>
<li>some menu item</li>
<li>some menu item</li>
</ul>
</div>
<div>
</div>
Как вы можете видеть, что это удаляет список, когда уль тег находится на том же уровне, что и метки с текстом в них. Тег ul является частью текста, который находится на странице и не имеет ничего общего с макетом страницы. Значок ul с элементами меню важен для страницы, так как это определяет, есть ли там меню и имеет 3 разных элемента.
Можете ли вы привести пример того, как HTML должен выглядеть, после модификации? – CanB