2015-02-21 2 views
0

Теперь я создаю веб-паук с помощью python, и некоторая часть программы просит меня получить некоторые строки, такие как data-id = "48859672" с веб-сайта. Я успешно получил эти строки с помощью:Как я могу получить часть строки соответствия RegEx в Python?

pattern=re.compile(r'\bdata-id="\d+"') 
m=pattern.search(html,start) 

Но я теперь интересно, как получить только число часть строк, кроме целой строки?

ответ

1

Использовать capturing group или lookarounds.

>>> pattern=re.compile(r'\bdata-id="(\d+)"') 
>>> s = 'data-id="48859672"' 
>>> pattern.search(s).group(1) 
'48859672' 

ИЛИ

>>> pattern=re.compile(r'(?<=\bdata-id=")\d+(?=")') 
>>> s = 'data-id="48859672"' 
>>> pattern.search(s).group() 
'48859672' 
Смежные вопросы