У меня есть мой HTML-код, который выглядит ниже. Я хотел бы получить текст, который находится в <span class="zzAggregateRatingStat">
. В соответствии с приведенной ниже, например, я хотел бы получить 3 и 5.Получение данных с использованием Python & lxml
Для этой работы я использую python2.7 & LXML
<div class="pp-meta-review">
<span class="zrvwidget" style="">
<span g:inline="true" g:type="NumUsersFoundThisHelpful" g:hideonnoratings="true" g:entity.annotation.groups="maps" g:entity.annotation.id="http://maps.google.com/?q=Central+Kia+of+Irving++(972)+659-2204+loc:+1600+East+Airport+Freeway,+Irving,+TX+75062&gl=US&sll=32.83624,-96.92526" g:entity.annotation.author="AIe9_BH8MR-1JD_4BhwsKrGCazUyU5siqCtjchckDcg5BAl5rOLd9nvhJJDTrtjL-xFI8D42bD_7">
<span class="zzNumUsersFoundThisHelpfulActive" zzlabel="helpful">
<span>
<span class="zzAggregateRatingStat">3</span>
</span>
<span>
<span> </span>
out of
<span> </span>
</span>
<span>
<span class="zzAggregateRatingStat">5</span>
</span>
<span>
<span> </span>
people found this review helpful.
</span>
</span>
</span>
</span>
</div>
* Получите текст, который находится в. * <- завершите это предложение, пожалуйста, – PenguinCoder
... и закончить вопрос, показывая, что вы пробовали. –
Мне очень жаль опечатку. Stackoverflow принял это как HTML-тег –