Я довольно новый для Python, так застряли в этой проблеме:как удалить часть текста в питоне
есть TXT-файл, как
blahh
blah
blah
...
<start>
some stuff
</start>
even more blah blah blah
Я хочу, чтобы удалить все ли детали до <start>
и после </start>
. (Главное из этого link.Я хочу сделать html-материал на странице bs4, поэтому я должен сначала удалить все части, отличные от html.
Может кто-нибудь скажет мне, что лучше способ сделать это Ценит любой помогает
@ AJ: Пожалуйста, не предлагайте разбор HTML с регулярными выражениями. Прочитайте http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags (и l чернилами к тегу просто бесполезно.) – geoffspear