Мне нужно получить данные обзора веб-сайта, но данные пользователя выгружены. Комментарии на странице - 10 полосок, а их около 100. Как я могу сканировать все из них?Использование scrapy для получения данных «Следующая страница»
My intention is to use the yield and Request method to crawl the "Next Page" link, and then using the Xpath to extract data. But I can't jump to the next page to extract the data.
Вот Html код о "Следующая страница" ссылка:
<div class="xs-pagebar clearfix">
<div class="Pagecon">
<div class="Pagenum">
<a class="pre-page pre-disable">
<a class="pre-page pre-disable">
<span class="curpage">1</span>
<a href="#" onclick="tosubmits(2):return false;">2</a>
<a href="#" onclick="tosubmits(3);return false;">3</a>
<span class="elli">...</span>
<a href="#" class="next-page" onclick="tosubmits('2');return false;">Next Page</a>
<a href="#" onclick="tosubmits('94');return false;">Final Page</a>
</div>
</div>
</div>
Что href="#"
точно означает?
Благодарим вас за разъяснения. Что касается этого, знаете ли вы какой-либо другой метод для завершения работы? Я был уложен этим в течение нескольких дней. – samlong
Как я уже сказал, вы можете использовать splinter или заглянуть в инструменты chrome dev, чтобы узнать, что вызывает JavaScript: http://stackoverflow.com/questions/8550114/can-scrapy-be-used-to-scrape-dynamic- content-from-websites-that-are-using-ajax –
Большое спасибо! Используя Splinter, я решил проблему! Splinter - это мощный инструмент для решения проблем с динамическими веб-страницами, мне это очень нравится! – samlong