Я пытаюсь выбрать элементы (a) с XPath 1.0 (или, возможно, с Regex), которые следуют за братьями и сестрами определенного элемента (b), но только предшествуют другому элементу b.XPath "следующие братья и сестры до"
<img><b>First</b><br>
<img> <a href="/first-href">First Href</a> - 19:30<br>
<img><b>Second</b><br>
<img> <a href="/second-href">Second Href</a> - 19:30<br>
<img> <a href="/third-href">Third Href</a> - 19:30<br>
Я попытался сделать образец как можно ближе к реальному миру. Таким образом, в этом случае, когда я в элементе
<b>First</b>
нужно выбрать
<a href="/first-href">First Href</a>
и когда я на
<b>Second</b>
нужно выбрать
<a href="/second-href">Second Href</a>
<a href="/third-href">Third Href</a>
Любая идея, как достичь этого? Спасибо!
Можно ли считать, что xml хорошо сформирован, то есть элементы 'br' на самом деле'
'?Кроме того, элементы 'img' имеют контент и заканчиваются символом' /> '? Это действительно помогло бы, если бы «реальный мир» включал хорошо сформированный XML, если не XPath не является вариантом. – AnthonyWJones
Будучи примером реального мира, конечно, он не очень хорошо сформирован. Я бы хотел, чтобы это было :(Однако я использую Html Agility Pack (.NET) для обработки разметки и переносит плохо сформированные документы, если это какая-то помощь. –
Нет причин предполагать, что «реальный мир» подразумевает -форматный xml. Есть много примеров html, поставляемых как хорошо сформированный xml. Конечно, вы упомянули о маневренности в вопросе, который он бы сделал сценарием более ясным. Добавлен соответствующий тег. – AnthonyWJones