У меня есть строка, как это:как получить submatch матча в питона регулярных выражений
Str =»< ТЕМЫ> < D> какао </D> </ТЕМЫ> < МЕСТ> < D > эль-Сальвадор </D> < D> США </D> < D> уругвай </D> </МЕСТ>»
Я хочу, чтобы получить строку между < D> и </D> в < ДОСТОПРИМЕЧАТЕЛЬНОСТИ> и </ДОСТОПРИМЕЧАТЕЛЬНОСТИ>. Я знал проточный:
p1=re.compile(r'(?<=<PLACES>)(.*?)(?=</PLACES>)')
p2=re.compile(r'(?<=<D>)(.*?)(?=</D>)')
с p1 и p2, я могу получить эль-Салвадор, США, uruguay.But как я могу получить информацию с только р.
Избегайте использования регулярное выражение и использовать парсер. – hwnd
[обязательное чтение] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags) – shx2