2012-03-29 6 views
-1

Как извлечь атрибут метки привязки (т. Е. Значение href) с помощью модуля Python и HTMLParser.anchor tag HREF extract

например. У меня есть HTML-код, и мне нужно его разобрать и найти значение тега привязки с помощью текста.

+1

Вы еще что-нибудь пробовали? Где произошел сбой вашего кода? – hochl

+1

Возможный дубликат [как я могу получить ссылки href из html-кода] (http://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code) – Marcin

ответ

1

This question on Stack Overflow показывает, как извлекать ссылки с помощью HTMLParser.

Но более удобным способом является использование BeautifulSoup и this question показывает способ сделать именно это. Посмотрите документацию BeautifulSoup, если вы хотите сделать более продвинутое очищение содержимого HTML.