2014-11-06 2 views
0

Мне нужно получить данные обзора веб-сайта, но данные пользователя выгружены. Комментарии на странице - 10 полосок, а их около 100. Как я могу сканировать все из них?Использование scrapy для получения данных «Следующая страница»

My intention is to use the yield and Request method to crawl the "Next Page" link, and then using the Xpath to extract data. But I can't jump to the next page to extract the data. 

Вот Html код о "Следующая страница" ссылка:

<div class="xs-pagebar clearfix"> 
    <div class="Pagecon"> 
      <div class="Pagenum"> 
       <a class="pre-page pre-disable"> 
       <a class="pre-page pre-disable"> 
       <span class="curpage">1</span> 
       <a href="#" onclick="tosubmits(2):return false;">2</a> 
       <a href="#" onclick="tosubmits(3);return false;">3</a> 
       <span class="elli">...</span> 
       <a href="#" class="next-page" onclick="tosubmits('2');return false;">Next Page</a> 
       <a href="#" onclick="tosubmits('94');return false;">Final Page</a> 
      </div> 
    </div> 
</div> 

Что href="#" точно означает?

ответ

0

К сожалению, вы не сможете сделать это с помощью scrapy. href="#" - это привязка, которая просто связывает нигде (чтобы это выглядело как ссылка). На самом деле происходит обработчик javascript onclick. Вам понадобится метод выполнения javascript, чтобы сделать это для вашего случая использования. Вы можете посмотреть на Splinter, чтобы сделать это.

+0

Благодарим вас за разъяснения. Что касается этого, знаете ли вы какой-либо другой метод для завершения работы? Я был уложен этим в течение нескольких дней. – samlong

+0

Как я уже сказал, вы можете использовать splinter или заглянуть в инструменты chrome dev, чтобы узнать, что вызывает JavaScript: http://stackoverflow.com/questions/8550114/can-scrapy-be-used-to-scrape-dynamic- content-from-websites-that-are-using-ajax –

+0

Большое спасибо! Используя Splinter, я решил проблему! Splinter - это мощный инструмент для решения проблем с динамическими веб-страницами, мне это очень нравится! – samlong

Смежные вопросы