2015-09-15 3 views
1

Это мое регулярное выражение:Как использовать селектор scrapy re()?

".*\/(.*)\?ref" 

Это моя тестовая строка:

/product/sam/go-with-me?ref=popular 

я могу получить: go-with-me
я примерить https://regex101.com/#python

Но я не знаю, как писать со скрипом, ничего не получается

Вот мой код:

for site in sites: 
    title = sel.css("a::text").re(r".*\/(.*)\?ref") 
    print title 
    break 
+0

Можете ли вы поделиться образец HTML-кода, содержащий нужную ссылку? (или поделитесь ссылкой на веб-страницу) – alecxe

ответ

0

Трудно сказать, не видя реального HTML входных данных, но вы, возможно, просто нужно смотреть в href значение атрибута вместо текста:

for site in sites: 
    title = site.xpath(".//a/@href").re(r".*\/(.*)\?ref") 
    print title 
    break 
+0

Вы правы. Я был слишком неосторожен – user2492364

Смежные вопросы