2015-08-18 7 views
-1

lxml Использование и requests Я передаю XPATH получить href атрибуты a тегов. Каждый раз, когда я использую простой код ниже, я получаю AttributeError, как показано ниже.Python 3.4: HREF с XPATH

import requests 
from lxml import html 
import csv 




url = 'https://biz.yahoo.com/p/sum_conameu.html' 

resp = requests.get(url) 
tree = html.fromstring(resp.text) 

update_tick = [td.text_content() 
       for td in tree.xpath('''//tr[starts-with(normalize-space(.), "Industry")] 
             /following-sibling::tr[position()>0] 
             /td/a/@href''')] 

print(update_tick) 


AttributeError: 'str' object has no attribute 'text_content' 
+0

update_tick уже текст – Raghavendra

ответ

3

Передача селектор атрибута XPath (.../@href) для xpath() метода делают его возвращать строковые значения соответствующих атрибутов. Нет необходимости звонить text_content() в этом случае:

update_tick = [td 
       for td in tree.xpath('''//tr[starts-with(normalize-space(.), "Industry")] 
             /following-sibling::tr[position()>0] 
             /td/a/@href''')]