У меня есть следующие правилаScrapy пропускает мои запрещающие правила
Rule(SgmlLinkExtractor(allow=r'.*?', deny=r'/preferences')),
Rule(SgmlLinkExtractor(allow=r'.*?', deny=r'/auth')),follow=True),
Но я вижу следующее в журналах. Я также пробовал это без allow = и это все равно. Нужно ли игнорировать эти URL-адреса из промежуточного программного обеспечения?
014-01-08 21: 31: 07 + 0100 [mybot] ОТЛАДКА: просканированных (200) http://mydomain.com/preferences/language?continue_to=xxxxx> (реферер: http://mydomain.com/categories/something-something-something)