Это может быть совершенно глупый вопрос, но google не имеет смысла. Во-первых, конечно, импортировать библиотеки мне нужно:Выход lxml в Python 2.7
from lxml import html
from lxml import etree
import requests
достаточно просто. Теперь для запуска и анализа кода. Ссылка в этом случае - еженедельное обеденное меню для местного ресторана. Здесь мы готовим код для извлечения наших бит из него.
page = requests.get("http://www.farozon.se/lunchmeny-20207064")
tree = html.fromstring(page.text)
htmlparser = etree.HTMLParser()
tree2 = etree.parse(page.raw, htmlparser)
Теперь давайте посмотрим на меню! Как вы можете видеть, я тестирую несколько разных способов получения желаемого результата.
friday = tree.cssselect("#block_82470858 > div > div > div.h24_frame_personal_text.h24_frame_padding > div > table > tbody > tr:nth-child(4)")
test = tree.xpath("/html/body")
Давайте просто напечатаем вывод, чтобы узнать, что получилось.
print page
print tree.cssselect('#block_82470858 > div > div > div.h24_frame_personal_text.h24_frame_padding > div > table > tbody > tr:nth-child(4)')
print tree2
print friday
print test
Ожидание возможности съесть некоторые ... Подождите, это не еда. Что это? В моей попытке выше и в моей IDE я пробовал 20 лучших ссылок Google для lxml и запросов, все они выводят одно и то же, но утверждают, что выводят фактический html. Я понятия не имею, что происходит.
<Response [200]>
[<Element tr at 0x30139f0>]
<lxml.etree._ElementTree object at 0x2db0dd0>
[<Element tr at 0x30139f0>]
[<Element body at 0x3013a48>]
попробуйте добавить '.text' на конце некоторых из ваших объектов ... – MattDMo
я попробовал добавляя '.text' буквально в любом месте, он либо выводит то же, либо ошибку. Это мой первый проект python, поэтому, если у вас есть определенное место в памяти, пожалуйста, разделите. – Ruhpun