Я хочу лом некоторых данных по следующей ссылке:данные скоблить с Духом
Моя цель просто получить таблицу всех инструментов (отображается в разделе «Результаты поиска» на стр 1,2 , 3 и т. Д.) В data.frame
. Я не могу просто использовать urllib
и urllib2
для извлечения статических данных, так как мне нужно подражать человеку, нажимая на кнопки: Ghost
или Selenium
- это путь.
Однако, я действительно не понимаю, как перевести код в «нажмите на страницу 2», «щелкните на странице 3» ..., а также получите общее количество страниц.
Мой код:
from ghost import Ghost
url = "http://www.six-structured-products.com/en/search-find/new-search#search_type=profi&class_category=svsp"
gh = Ghost()
page, resources = gh.open(url)
Я застрял там и не знаю, какой идентификатор поставить вместо XXX:
page, resources = ghost.evaluate(
"document.getElementById(XXX).click();", expect_loading=True)
(я бы также принять решение, используя Selenium
)
Благодарим вас за подробный ответ! На самом деле очень ясно, ожидаем, что объект PySide и QtWebkit я вообще не знаком ... например, как я могу получить доступ к объектам 'lines [0]', значение атрибута 'data-isin' в первом' td' ? И название изображения, расположенного в 6-м 'td' (значение - Deutsche bank)? –
Все в порядке, синтаксис jquery был далек от моих знаний, но он хорошо документирован :) –