2016-11-10 8 views
1

извлечь текст из ссылок с BeautifulSoup как:BeautifulSoup разобрать специальный символ

from BeautifulSoup import BeautifulSoup 
import urllib2 
response = urllib2.urlopen(link) 
html = response.read() 
soup = BeautifulSoup(html) 

#print(soup) 
for a in soup.findAll('a',attrs={"class":"link"}): 
    print(a.text) 

Но я получаю некоторые символы, такие как «&#8211» для простого «-». Как получить эти символы для людей?

ответ

1

Попробуйте следующее:

for a in soup.findAll('a',attrs={"class":"link"}): 
    print(a.get_text()) 
Смежные вопросы