2014-05-22 2 views
0

Я столкнулся со следующей проблемой, для которой я не могу думать о хорошем решении, использующем регулярные выражения. Пожалуйста, помогите с предложениямиРегулярное выражение для поиска и замены со сложной HTML-страницы

У меня есть HTML-файл, который я хотел бы, чтобы выделить некоторые части содержания (предложения) с кодом

"<span style="background-color:#FFFF00">...</span>" 

, так что выделены те части. Похоже на то, что в файле HTML, который у меня есть, есть полезная информация со всеми видами нежелательной почты между ними. Допустим, строка Я заинтересован в освещении в моей строке А = «Я довольно облажался с этим HTML»

оригинальный HTML код выглядит как:

......<span class="_ _3"> </span>I<span class="_ _3"> </span> <span class="fc3">am</span> pretty<span class="_ _3"> </span>screw<span class="_ _3">ed</span> <span class="_ _3"> </span>up</div> <div class="t m0 x19 hb y5f ff4 fs7 fc2 sc0 ls0 ws0">with this<span class="_ _3"> </span><span class="ff7">HT<span class="_ _8"></span></span>ML</div>..... 

Я хотел бы использовать регулярные выражения чтобы найти исходную строку A и добавить к ней элемент выделения. Таким образом, окончательный вывод должен быть

......<span class="_ _3"> </span><span style="background-color:#FFFF00">I</span><span class="_ _3"> </span> <span class="fc3"><span style="background-color:#FFFF00">am</span></span> <span style="background-color:#FFFF00">pretty</span><span class="_ _3"> </span><span style="background-color:#FFFF00">screw</span><span class="_ _3"><span style="background-color:#FFFF00">ed</span></span> <span class="_ _3"> </span><span style="background-color:#FFFF00">up</span></div> <div class="t m0 x19 hb y5f ff4 fs7 fc2 sc0 ls0 ws0"><span style="background-color:#FFFF00">with this</span><span class="_ _3"> </span><span class="ff7"><span style="background-color:#FFFF00">HT</span><span class="_ _8"></span></span><span style="background-color:#FFFF00">ML</span></div>..... 

ответ

0

Мой совет - не использовать REGEX для HTML, а использовать BeautifulSoup или аналогичную библиотеку, используя правильный инструмент для работы.

Смежные вопросы