2014-05-21 7 views
1

Я слом сайт, который есть система разбивки на страницы на основе JavaScript, поэтому я хочу, чтобы извлечь номер страницы из @href атрибута, это как ссылка взгляд:Получить значение из атрибута @href

<a href="javascript:AllerAPage('1', 'element_id');">Page 1</a> 
поддержка

ответ

2

Scrapy selectorsregular expressions:

sel.xpath('//a/@href').re(r"javascript:AllerAPage\('(\d+)',") 

Обратите внимание, что //a/@href XPath exression пример один - у вас может быть другой.

Demo показывает работу регулярных выражений, я при условии:

>>> import re 
>>> s = "javascript:AllerAPage('1', 'element_id');" 
>>> re.search("javascript:AllerAPage\('(\d+)',", s).group(1) 
'1' 
+0

это волшебство, спасибо u :) –

Смежные вопросы