Надеюсь, вы все в порядке. Я новичок в Python и использую python 2.7.Python 2.7 BeautifulSoup, очистка электронной почты
Я пытаюсь извлечь только MAILTO из этого общего каталога веб-бизнеса: http://www.tecomdirectory.com/companies.php?segment=&activity=&search=category&submit=Search
на почту я ищу являются письма, упомянутые в каждом виджете из-з в полном каталоге. К сожалению, в этом каталоге нет API. Я использую BeautifulSoup, но пока не добился успеха.
здесь mycode:
import urllib
from bs4 import BeautifulSoup
website = raw_input("Type website here:>\n")
html = urllib.urlopen('http://'+ website).read()
soup = BeautifulSoup(html)
tags = soup('a')
for tag in tags:
print tag.get('href', None)
то, что я получаю только сайт фактического сайта, как http://www.tecomdirectory.com с другим HREF, а затем MailTo или веб-сайты в виджетах. я также попытался заменить суп ('а') супом («цель»), но не повезло! Может ли кто-нибудь помочь мне, пожалуйста?
Hi! Спасибо за ответ! в URL-адресе я читаю php? поэтому я предположил, что в нем может быть несколько php! Извините, если нет! Еще нова в кодировании. привет – PIMg021
Привет, пожалуйста, подтвердите, что нет участия в php, так что я могу отредактировать вопрос, удалив тег php? – PIMg021