2014-09-16 2 views
0

Я пытаюсь очистить простой веб-сайт и написал код. , но я получаю пустой результат (нет данных) .please помогите мне/посоветуйте мне, где я делаю неправильно. Я пробовал очистить его, используя lxml, тогда я тоже пробовал селен, но не успел.получение пустых данных при очистке веб-сайта с помощью lxml

from selenium import webdriver 
import lxml.html as lh 
import time 

browser = webdriver.Firefox() 

browser.get('http://usa.kyoceradocumentsolutions.com/americas/jsp/Kyocera/wheretobuy_result.jsp?cat=2&zipcode=98413&city=&state=NJ') 

time.sleep(5.0) 

content = browser.page_source 

tree = lh.fromstring(content) 

for d in (tree.xpath('//table/tr/td[@class="bodytxt"]/b/text()')): 
    print(d) 

ответ

2

Он не обрабатывает кадр по умолчанию, я согласен с ключом, что его лучше использовать прямой адрес этого конкретного кадра, а вот XPath для имени и адрес наименование:

//td[@class="bodytxt" and @align="left" and (b)]//b//text() 

адрес:

//td[@class="bodytxt" and @align="left" and (b)]/text() 

для обоих:

//td[@class="bodytxt" and @align="left" and (b)]//text() 
+0

это действительно работает .THANKS mate.you являются genius.Thanks снова – user3891081

+0

Привет, я снова в trouble.I хочу, чтобы очистить http://hosted.where2getit.com/sharpsiica/index.html?form = locator_search & sku = ARM355 & addressline = 25303 & zip = 25303, но я получаю слишком много неправильных данных. Теперь я попытался // td [@ align = "left" и (br)], но я не получаю правильные данные. Мне нужно только имя и адрес. Заранее спасибо – user3891081

+0

Не могли бы вы помочь мне решить вышеуказанную проблему – user3891081

Смежные вопросы