2016-10-09 2 views
-5

У меня есть это регулярное выражение:Регулярное выражение удаление <[CDATA [

</title>[\s]*<description[^>]*>(.*?)<img 

, которая принимает строку:

<title>Insane price of last Ford Falcon V8s</title> 
     <description><![CDATA[FORD dealers are charging a staggering $30,000 more than the recommended retail price — up from $60,000 to $90,000 — for the final Falcon V8 sedans as buyers try to secure a future classic.<img alt="" border="0" src="https://pixel.wp.com/b.gif?host=www.couriermail.com.au&#038;blog=87782261&#038;post=1205849&#038;subd=couriermailatnewscorpau&#038;ref=&#038;feed=1" width="1" height="1" />]]></description> 

как я могу изменить это регулярное выражение также удалить <![CDATA[

ответ

0

Регулярные выражения - действительно могучий инструмент. Это включает в себя высокий риск получения ошибок в вашем коде, особенно если вы не знаете, как правильно их обрабатывать (похоже, это так).

Вы должны всегда использовать встроенный класс строк Python и только использовать RegEx, если это необходимо.

Если у вас есть строка my_str, то следующий код заменяет подстроку в my_str:

my_str = "hello world" 
my_str.replace("lo", "") 
>>> "hel world" 

str.replace поиск для «вот» в данном случае и заменяет его «» (ничего, таким образом, удаляя его). Конечно, вы можете изменить эти значения по своему усмотрению.

Посмотрите на Python's documention for Strings.

Смежные вопросы