Я пытаюсь сделать некоторое извлечение с помощью scrapy, но он не возвращает ожидаемый html, я не знаю, в чем проблема, если это может быть безопасность сайта или что-то еще , потому что другие страницы возвращают правильный результат.Scraw crawler не возвращает ожидаемый html
Я пытаюсь извлечь список сообщений по этой ссылке http://www.reclameaqui.com.br/busca/?q=estorno&empresa=Netshoes&pagina=2, что касается неудовлетворенности клиентов услугами и продуктами, но html, возвращенный с помощью приведенного выше кода, не содержит список сообщений, просто простой html почти пустой.
Кто-нибудь знает, что может случиться? Проблема, вызывающая блокировку правильного извлечения?
код прост, это то же самое с Scrapy учебника:
Я уже пробовал некоторые гусеничный настольный компьютер или онлайн-инструментов, а результат тот же.
import scrapy
class DmozSpider(scrapy.Spider):
name = "dmoz"
allowed_domains = ["reclameaqui.com.br"]
start_urls = [
"http://www.reclameaqui.com.br/busca/q=estorno&empresa=Netshoes&pagina=2"
]
def parse(self, response):
filename = response.url.split("/")[-2] + '.html'
with open(filename, 'wb') as f:
f.write(response.body)
Отличное объяснение – Ryan
спасибо, это очень поможет началу моей работы, я постараюсь заставить ее работать – Guthierrez