2016-01-22 3 views
0

Я использую scrapy на следующем веб-сайте, чтобы получить URL-адреса футбольного матча. http://www.spox.com/de/daten/?sport=soccer&page=season&id=9643&view=matchesscrapy тот же url различный исходный контент

Пока что так хорошо, что все URL-адреса из 25 совпадений показаны, но есть кнопка «назад» («Zurück»), чтобы показать больше совпадений, но она использует тот же URL-адрес. Итак, как я могу сказать, что нужно нажать эту кнопку, а также взять URL-адрес этого совпадения?

ответ

1

При нажатии кнопки «Назад» браузер делает XMLHttpRequest. Я бы предложил запустить консоль вашего браузера и проверить сетевой трафик после нажатия кнопки «Назад». Вы увидите URL-адрес, с которого страница получает данные. Используйте этот url для дальнейшего соскабливания.

+0

Или используйте Splash (https://github.com/scrapinghub/splash), чтобы отобразить страницу и нажмите кнопку. Но обратное проектирование в этом случае может быть проще и быстрее. –

Смежные вопросы