Я только начал с веб-соскабливания с Python и ударил стену. Я использую библиотеку запросов, чтобы получить код HTML с веб-сайта. Например, Google сайт Результат поиска: «https://www.google.com/?gws_rd=ssl#q=ball»Получение всего HTML от request.get()
Когда я ударил F12 и проверить HTML, это выглядит иначе, чем с:
site = requests.get("https://www.google.com/?gws_rd=ssl#q=ball")
print(site.text)
с requests.get
, текст намного короче, и не все информация видна (она начинается с !doctype
, однако). Из-за этого я не могу работать с этим HTML.
Можете ли вы сказать мне, где ошибка?
Это на самом деле упражнение из книги «Автоматизация скучных вещей с помощью Python». Задача состоит в том, чтобы найти какой-то элемент Google, а затем найти несколько первых результатов с помощью локаторов HTML. Я не могу этого сделать, потому что, когда я использую requests.get()
, я не вижу никаких объектов для ссылок в HTML-коде.
Помимо того факта, что некоторые факторы влияют на то, что возвращает Google, существует также динамическое создание контента с помощью js –
Похоже, это также может быть полезно - http://stackoverflow.com/questions/22623798/google-search-with-python -requests-library –