У меня есть поле «тело» в моей таблице (MySQL) и там много записей, как:Как удалить ненужные теги?
</p><p> </p><p>
</p><p>
</p><p>
Много пространства, новой линии, & NBSP и т.д. Как его удалить?
Это не работает:
text.replace('</p><p> </p><p>', '</p><p>')
text.replace('</p><p>\n</p><p>', '</p><p>')
Это был бы лучший способ обработки таких вещей, как комментарии или значения атрибутов, содержащие «
» правильно. Но в большинстве случаев работает простой поиск и замена. –[lxml] (http://lxml.de/) будет хорошим выбором – Dikei