Что я хочу сделать, это изменить каждый тег (будь то его <a href=>
или <title>
или </title>
или </div>
... и т. Д.) На символ.Изменить все теги html на символ с помощью python
Я попытался использовать красивый суп, но он находит только теги, которые я определяю ...
Я нашел некоторый код в HTMLparser.py
tagfind = re.compile('([a-zA-Z][^\t\n\r\f />\x00]*)(?:\s|/(?!>))*')
Я считаю, это то, что я ищу Я просто не знаю, как правильно его использовать.
Кроме того, я полагал, что я мог бы использовать:
handle_starttag(self, tag, attrs):
Но я не хочу, чтобы определить тег, я просто хочу сценарий, чтобы найти каждый тег и изменить его на что-то ...
Возможно ли это?
Благодарим за оказанную помощь!
Очень много тегов. Какова ваша конечная цель? –
Удалить тег EVERY из HTML и заменить их на символ –
Я имею в виду, почему вы хотите это сделать? –