2016-11-30 2 views
0

Я использую библиотеку lxml, чтобы получить значение атрибута с HTML-страницы.Извлечение значения атрибута с помощью lxml

Например:

<span class="you-save">Rs. 5000</span> 

Я получаю правильный результат (5000), используя ниже

print doc.xpath('//span[@class="you-save"]//text()') 

Я хочу, чтобы получить значение атрибута, например

<meta itemprop="price" content="4999.00"> 

I хочу извлечь «4999.00». Я не могу это понять.

Я пробовал только, но не получаю результатов.

print doc.xpath('//meta[@itemprop="price"]/content::text()') 

ответ

1

Вы использовать атрибут оси с помощью @ для извлечения значений атрибутов.

Например:

from lxml.etree import fromstring 

xml = """<some> 
<nodes> 
<meta itemprop="price" content="4999.00"></meta> 
</nodes> 
</some>""" 

doc = fromstring(xml) 
print(doc.xpath('//meta[@itemprop="price"]/@content')) 
Смежные вопросы