У меня есть этот HTML тег:Как получить первое появление? регулярное выражение питона
x=""" <div>ad</div> \n\n <div> correct value </div> <div> wrong value </div> """
Я хочу, чтобы получить corret value
так я искать слово ad
с последующим </div>
тогда любая вещь до другого <div>
затем получить все значения до </div>
Я использую этот код:
re.findall(r'ad</div>.*<div>(.*)</div>',x,re.S)
Я использую falg re.S, потому что хочу, чтобы точка соответствовала новой строке. Я не знаю, сколько строк между div. поэтому я использую. *!
Я думаю, что findall должен вернуть correct value
, но он возвращает wrong value
. Зачем ? он ищет последний div, а не первый?
Пожалуйста, прочитайте это: http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags#answer-1732454 –
@DanielRoseman, так что я не должен» t пользователь regex разобрать html, что вы предлагаете? – david
HTML-парсер. BeautifulSoup - хороший. –