2015-10-15 2 views
1

Я пытаюсь очистить веб-страницу, но я не могу получить html-текст сайта с использованием селена.BeautifulSoup не получит источник страницы, используя селен

вот мой код до сих пор

from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 
from selenium.webdriver.common.by import By 
from selenium.webdriver.support.ui import WebDriverWait 
from selenium.webdriver.support import expected_conditions as EC 
from bs4 import BeautifulSoup 
import urlparse 

search_term = raw_input("What is your search term?: ") 
url = "https://www.google.co.uk/search?client=ubuntu&channel=fs&q=" 
googurl = url+search_term 
driver = webdriver.Firefox() 

htmltext = driver.get(googurl) 
soup = BeautifulSoup(htmltext.page_source) 

делает это я получаю отслеживающий

What is your search term?: hi 
Traceback (most recent call last): 
    File "google page click.py", line 15, in <module> 
    soup = BeautifulSoup(htmltext.page_source) 
AttributeError: 'NoneType' object has no attribute 'page_source' 

ответ

1

Вы хотите всегда использовать объект драйвера:

driver.get(googurl) 
soup = BeautifulSoup(driver.page_source) 
+0

Thankyou для этого, это работаю сейчас. – booberz

Смежные вопросы