Как извлечь атрибут метки привязки (т. Е. Значение href) с помощью модуля Python и HTMLParser.anchor tag HREF extract
например. У меня есть HTML-код, и мне нужно его разобрать и найти значение тега привязки с помощью текста.
Как извлечь атрибут метки привязки (т. Е. Значение href) с помощью модуля Python и HTMLParser.anchor tag HREF extract
например. У меня есть HTML-код, и мне нужно его разобрать и найти значение тега привязки с помощью текста.
This question on Stack Overflow показывает, как извлекать ссылки с помощью HTMLParser.
Но более удобным способом является использование BeautifulSoup и this question показывает способ сделать именно это. Посмотрите документацию BeautifulSoup, если вы хотите сделать более продвинутое очищение содержимого HTML.
Вы еще что-нибудь пробовали? Где произошел сбой вашего кода? – hochl
Возможный дубликат [как я могу получить ссылки href из html-кода] (http://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code) – Marcin