У меня есть функция, которая анализирует HTML-код, поэтому его легко читать и писать. Чтобы сделать это, я должен разбить строку на несколько разделителей, и, как вы можете видеть, я использовал re.split()
, и я не могу найти лучшего решения. Однако, когда я отправляю некоторый HTML, такой как this, он абсолютно не влияет. Это заставило меня поверить, что мое регулярное выражение неправильно написано. Что там должно быть?Почему это регулярное выражение не работает?
def parsed(data):
"""Removes junk from the data so it can be easily processed."""
data = str(data)
# This checks for a cruft and removes it if it exists.
if re.search("b'", data):
data = data[2:-1]
lines = re.split(r'\r|\n', data) # This clarifies the lines for writing.
return lines
Это не является дубликатом, если вы нашли подобный вопрос, я ползал в течение веков, и она по-прежнему не работает.
* У меня есть функция, которая анализирует HTML-код, поэтому его легко читать и писать. * Ouch. Почему бы не использовать парсер HTML вместо этого? BeautifulSoup делает это в одном. –
'from bs4 import BeautifulSoup',' print (BeautifulSoup (data) .prettify()) '. –
Обязательная ссылка: http://stackoverflow.com/a/1732454/10077 –