Я хотел бы написать скрипт скрепера для получения комментариев из статей cnn. Например, эта статья: http://www.cnn.com/2012/01/19/politics/gop-debate/index.html?hpt=hp_t1Получить комментарии с веб-сайта с помощью disqus
Я понимаю, что cnn использует disqus для обсуждения комментариев. Поскольку загрузка комментариев не основана на веб-странице (т. Е. Предыдущая страница, следующая страница) и является динамической (т. Е. Нужно нажать «загрузить следующие 25»), я понятия не имею, как получить все 5000+ комментариев для этой статьи.
Любая идея или предложение?
Большое спасибо!
Вы спрашиваете, как царапать? или вы знаете, как очистить с помощью определенного инструмента, и вам нужна помощь в очистке системы комментариев на основе disqus? если его последний затем повторит вопрос, чтобы включить имя инструмента – Boaz
Привет, Боаз. Я спрашиваю, как очистить. Для веб-страницы с новостями, например http://www.guardian.co.uk/politics/2012/jan/10/scottish-independence-referendum-autumn-2014?commentpage=1, нам просто нужно заменить комментарий на 2 , 3, 4 .. и мы можем сделать http, чтобы загрузить страницу и очистить ее. С disqus, кажется, что нет способа получить все комментарии с http get ... – qwertyl