Я хочу сделать питон скрипт, который искать:Глядя на выражение правой RE (питон)
<span class="toujours_cacher">(.)*?</span>
Я использую этот RE:
r"(?i)\<span (\n|\t|)*?class=\"toujours_cacher\"(.|\n)*?\>(.|\n)*?\<\/span\>"
Однако, в некоторых из моих страниц , я нашел этот вид выражения
<span class="toujours_cacher">*
<span class="exposant" size="1">*</span> *</span>
поэтому я попытался это RE:
r"(?i)\<span (\n|\t|)*?class=\"toujours_cacher\"(.|\n)*?\>(.|\n)*?(\<\/span\>|\<\/span\>(.|\n)*?<\/span>)"
это нехорошо, потому что когда нет промежутка между ними, он ищет следующий.
Мне нужно удалить контент между пролетом с классом «toujours_cacher». Есть ли способ сделать это с помощью одного RE?
Я буду рад услышать любые Ваши предложения :)
Если вы разбираете HTML или XML, не пытайтесь использовать регулярное выражение. Взгляните на ETree, BeautifulSoup или на другую библиотеку разбора. –
Это не делает то, что вы думаете: '(. | \ N) *'. Вам нужно узнать о классах персонажей и о том, где положить скобки вокруг групп захвата. –
Для этого я могу использовать только «standart» python, это скрипт для людей, которые ничего не знают о программировании и кто не сможет установить модули. – whitefret