2013-09-24 5 views
0
page = urlopen("http://members.calbar.ca.gov/fal/Member/Detail//50225") 
soup = BeautifulSoup(page.read()).find("div", {"id": "moduleMemberDetail"}) 

if soup.find("td",text=re.compile(r"e-mail:")) : 
    email = soup.find("td",text=re.compile(r"email:")).findNext('td').encode_contents().strip() 
print(email) 

выходаПоиск текст внутри ссылки того видимого

<span href="mailto:[email protected]" id="e0">[email protected]<span>.</span>net</span>... 

я проверить HTML с поджигатели

оказывается, имеет более 1 пядь, что его невидимую.
Мой вопрос заключается в том, чтобы найти текст внутри ссылки электронной почты, что видно ???

ответ

1

Вы должны использовать find_all вместо find.

1

если вы хотели HREF значения, может быть, это поможет:

for node in soup.find_all('span', attrs = {'href': re.compile((r'.*mail.*'))}): 
    print(node.get('href')) 

Если вы не нуждаетесь в «электронной почте:» - вы можете просто заменить его.

+0

Ваш код покажет всю электронную почту, включая невидимую электронную почту. Мне просто нужен видимый – muhnizar

Смежные вопросы