Ваш вопрос был очень трудным для понимания, но из данного выходного примера похоже, что вы хотите удалить все из <
и >
из текста ввода. Это может быть сделано следующим образом:
import re
input_text = '<a bob>i <b>c</b></a>'
output_text = re.sub('<[^>]*>', '', input_text)
print output_text
Что дает вам:
i c
Если это не то, что вы хотите, пожалуйста, уточнить.
Обратите внимание, что подход к регулярному выражению для синтаксического анализа XML очень хрупкий. Например, приведенный выше пример разбился бы на вход <a name="b>c">hey</a>
. (>
- действительный символ в значении атрибута: see XML specs)
Python, а не PHP ... – msanders