Моего кода:питона повторно подразделы против FindAll
import urllib
import re
xml = urllib.urlopen('url').read()
Я заинтересован в удалении некоторых тегов и их содержимого из файла XML, следовательно, я пытаюсь использовать регулярные выражения.
, например:
re.findall(r'<fig(.*?)</fig>', xml, re.DOTALL)
возвращает спички и не является пустым.
однако
re.sub(r'<fig(.*?)</fig>', ' ', xml, re.DOTALL)
ничего не делает, то строка XML не изменяется. Я смущен, почему, пожалуйста, помогите.
Возможный дубликат [Почему re.findall() найти больше совпадений, чем re.sub()?] (Http://stackoverflow.com/questions/16371472/why-does-re-findall-find-more- match-than-re-sub) – ErlVolton
Просто улучшение. Разве вы не должны использовать хотя бы urllib2? –
Я нашел ответ на SO путем поиска в Google точного названия вашего вопроса ... – ErlVolton