Я пытаюсь найти лучший способ использовать HTML :: TreeBuilder в Perl, чтобы извлечь несколько абзацев текста из некоторого HTML в XML-файл.найти div с абзацем в perl с HTML :: TreeBuilder
У меня было это с использованием $tree->address
(или так я думал), пока не понял, что не все записи находятся в одном порядке.
Не выходя за каждый элемент в списке, кажется, что каждая запись имеет несколько элементов <div>
, но только один из <div>
имеет <p>
элементов в нем. И ни у одного из <div>
нет классов, что сделало бы это легко.
Я пробовал несколько разных способов, и поэтому ничто, кажется, не работает, в котором я могу извлечь текст в том, что я хочу. Я рассмотрел несколько разных примеров, но не они действительно достаточно близки к тому, что я ищу.
Было бы хорошо, если бы что-то вроде этого работал:
$bodyText = $tree->look_down('_tag' => 'div' => 'p');
Но это дает мне ошибку:
param list to look_down ends in a key!
В любом случае, может быть, кто-то может помочь мне точку в правильном направлении, у меня есть смотрел всю ночь, и теперь мой мозг болит.
Спасибо!
Джон
Не могли бы вы добавить примерный фрагмент HTML? – simbabque