2015-09-27 2 views
-3

Я ноб в селене с питоном. Я пытаюсь получить некоторые данные по этой ссылке: http://www.dcciinfo.com/dirinfo/companies/all/10888?start=30, данные, которые я хочу получить, - это название компании и помещено в excel, также скопируйте ссылку и вставьте ее в ту же колонку Excel. Затем следует перейти к следующей упомянутой компании. Может кто-нибудь, пожалуйста, помогите мне и дайте мне несколько советов, как переехать из одной компании в другую. Я не могу идентифицировать, используя id, xpath. То же самое нужно повторить на следующей странице и сделать для всех 65 страниц.Как получить индивидуальное название компании с веб-сайта в селене

Я только что написал основной код для селена:

browser = webdriver.Firefox() # Get local session of firefox 
browser.get("http://www.dcciinfo.com/dirinfo/companies/all/10888?start=30") # Load page 
x=browser.find_element_by_xpath("//*[@id='content']/form/div[1]/div[4]/div[1]") 

ответ

0

Использование .find_elements_by_xpath это будет возвращать список элементов. Затем вы можете пройти через него. Также используйте этот //*[@id="content"]/form/div/div/div[1]/a вместо вашего текущего xpath

+0

Нет, он не нажимает на элемент, используя xpath, который вы дали !! когда вы говорите цикл, какая переменная должна зацикливаться? –

+0

@EbrahimShariff это дает вам список элементов. Используйте для цикла на 'x' и метод click click для его элементов – MadRabbit

0

Я предпочитаю селектор CSS для XPath. Это должно возглавить вас в правильном направлении.

browser.get("http://www.dcciinfo.com/dirinfo/companies/all/10888?start=30") # Load page 
companies = browser.find_elements_by_css_selector("div.title > a") 
for company in companies: 
    company.text // put this in Excel as the company name 
    company.get_attribute("href") // put this in Excel as the company URL 

companies список из A тегов, которые содержат данные, которые вы хотите. href содержит URL-адрес компании, а .text содержит имя компании.

Смежные вопросы