Я пытаюсь получить все теги, содержащие поле «имя», а затем обрабатывать все предложение плюс имя. Это тестовый код у меня есть:Python re.findall
sourceCode = '<dirtfields name="one" value="stuff">\n<gibberish name="two"\nwewt>'
namesGroup = re.findall('<.*name="(.*?)".*>', sourceCode, re.IGNORECASE | re.DOTALL)
for name in namesGroup:
print name
Какой выход:
two
И выход я пытаюсь искать будет
['<dirtfields name="one" value="stuff">', 'one']
['<gibberish name="two"\nwewt>', 'two']
EDIT: Найденный способ сделать это, благодаря doublesharp для более чистого способа получить значение «имя».
namesGroup = re.findall(r'(<.*?name="([^"]*)".*?>)', sourceCode, re.IGNORECASE | re.DOTALL)
Что будет:
('<dirtfields name="one" value="stuff">', 'one')
('<gibberish name="two"\nwewt>', 'two')
Большое спасибо doublesharp. Это более чистый способ получить это =) – Neomind
're.DOTALL' здесь бесполезен. –
@ CasimiretHippolyte Очень верно ... ах вырезать и вставлять. Убрали его для ясности. – doublesharp