Я хотел бы извлечь URL-адрес из xpath, используя пакет запросов в python. Я могу получить текст, но ничего, что я пытаюсь, дает URL. Может ли кто-нибудь помочь?Извлечение URL-адреса href с запросами Python
ipdb> webpage.xpath(xpath_url + '/text()')
['Text of the URL']
ipdb> webpage.xpath(xpath_url + '/a()')
*** lxml.etree.XPathEvalError: Invalid expression
ipdb> webpage.xpath(xpath_url + '/href()')
*** lxml.etree.XPathEvalError: Invalid expression
ipdb> webpage.xpath(xpath_url + '/url()')
*** lxml.etree.XPathEvalError: Invalid expression
Я использовал этот учебник, чтобы начать работу: http://docs.python-guide.org/en/latest/scenarios/scrape/
Похоже, что это должно быть легко, но ничего не приходит во время моего поиска.
спасибо.
Можете ли вы предоставить значение xpath_url? В первой строке выглядит так, что xpath интерпретируется правильно, но следующие утверждения xpath могут быть неверными. – jeedo
@jeedo Ваш комментарий помог мне понять, что мой xpath закончил с «div/h2/a», и поэтому добавление просто '/ @ href' в соответствии с ответом Джеремии будет достаточным. Спасибо. –