Я экспериментировал с XPath через Python.Python. Некоторые выражения XPath не работают
Дело в том, что не все выражения работают.
Я только что нашёл XPath helper chrome extension.
Как вы видите, Chrome обнаруживает XPath, но Python этого не делает.
Сайт: link
Мой код:
import __future__
from lxml import html
import requests
from bs4 import BeautifulSoup
page = requests.get('http://directory.ccnecommunity.org/reports/rptAccreditedPrograms_New.asp?sort=institution')
soup = str(BeautifulSoup(page.content, 'html.parser'))
tree = html.fromstring(soup)
smth = tree.xpath('/html/body/table[@class="center"][2]/tbody/tr[1]/td[2]/table[2]/tbody/tr/td/table/tbody/tr/td[2]/table/tbody/tr/td/text()')
print(smth)
smth
список пуст. Зачем? Он должен был состоять из всех td
s, указанных в Xpath.
Это означает, что html не работает ??? Как я могу исправить это ... Я думал, что аргумент 'html.parser' от' BeautifulSoup' исправит это. –