Используя Twitter, например, этот код сбрасывает пятое твит из страницы Twitter. Страница содержит ссылку, за исключением случаев, когда я пытаюсь потянуть ее с помощью lxml и xpath, она отображает только текст, отрезающий ссылку от конца.Python - lxml/Получить полный контент xpath
Сценарий:
import urllib2
from lxml import etree
xpathselector = "/html/body/div/div[2]/div/div[5]/div[2]/div/ol/li[5]/div/div/p"
url = "https://twitter.com/memphismayfire"
response = urllib2.urlopen(url)
htmlparser = etree.HTMLParser()
tree = etree.parse(response, htmlparser)
result = tree.xpath(xpathselector)
print result[0].text
Печать:
'Miles Away' Acoustic доступен на ITunes! Кто скачал сингл ?! Давайте вернемся к диаграмме Singles! Ссылка:
HTML из XPATH Адрес:
<p class="js-tweet-text tweet-text">'Miles Away' Acoustic is available on iTunes! Who's downloaded the single?! Let's get it up the Singles Chart!! Link: <a title="http://smarturl.it/mmf-miles-away" target="_blank" class="twitter-timeline-link" data-expanded-url="http://smarturl.it/mmf-miles-away" dir="ltr" rel="nofollow" href="http://t.co/fU2hVqAiSq" f52ae163cfcf0237f="true"><span class="tco-ellipsis"></span><span class="invisible">http://</span><span class="js-display-url">smarturl.it/mmf-miles-away</span><span class="invisible"></span><span class="tco-ellipsis"><span class="invisible"> </span></span></a><div ida2bb72480="_p_mzkte2cwofawsu3r.t.co" style="cursor: pointer; width: 16px; height: 16px;display: inline-block;"> </div></p>
Какой самый лучший способ, чтобы напечатать все содержимое XPath вместо всего текста? Спасибо за помощь!
Для тех, кто собирается использовать lxml.etree см это: https://stackoverflow.com/questions/43280486/pylint-error-message-e1101-module-lxml -etree-нет-нет-стрип-теги-члена – illegaldisease