Я понял, может ли кто-нибудь сказать мне, что я делаю неправильно с этим кодом. У меня есть HTML-код и вы хотите прочитать «Основание года», которое в этом случае равно . Как мне это? Обратите внимание на пробел и пустую строку.Regex - дата чтения из HTML
Ниже приведен код
<h4> Founded in
</h4></td><td><h5> <!--10305--> 1949</h5></td></tr> <tr>
И это код, который я использую. И ничего не печатается.
myf = 'THE HTML HERE'
myf.replace("<!--10305-->", "")
year = re.findall(r"<h4> Founded in.*? (.*?)</h5></td></tr> <tr>", myf, re.DOTALL)
print year
Любая помощь будет принята с благодарностью.
«Я wounder, если кто-нибудь может сказать мне, что я делаю неправильно с этим кодом.» Возможно, вы используете Regex для анализа HTML ... – Veedrac
Используйте [lxml] (http://lxml.de/parsing.html#parsing-html), вероятно, с помощью XPath или CSS Selector. –
Разве сообщение о том, что одна ссылка на HTML-регулярное выражение Q & A выходит из моды? Потому что, если нет ... – austin