Я хочу узнать все URL-адреса и их имя с html-страницы с помощью lxml.получить все ссылки HTML, используя lxml
Я могу разобрать URL-адрес и узнать эту вещь, но есть ли какой-либо простой способ, с помощью которого я могу найти все ссылки на URL, используя lxml?
Обратите внимание, что HTML не XML; если у вас возникли проблемы с разбором из-за отсутствия конечных элементов или отсутствующих котировок вокруг значений атрибутов, [Beautiful Soup] (http://www.crummy.com/software/BeautifulSoup/) может помочь или может быть лучше подходит. –