Я пишу некоторый синтаксис для синтаксического анализа веб-сайта и получения всех href. Однако, когда я пытаюсь импортировать bs4, он выдает сообщение об ошибке «ImportError: невозможно импортировать имя« HTMLParseError ». Я использую Python 3.5.2.Ошибка при импорте Beautifulsoup
Я беру прошлую ссылку и знаю, что это может быть связано с старая версия bs4 и, следовательно, обновила ее до версии 4.5.1.Однако ошибка все еще существует.Это что-то не так с моим синтаксисом (я прилагаю ниже, что также из прошлой ссылки). Или мне нужно искать другой инструмент для выполнения этой задачи?
может кто-нибудь какие-либо идеи? еще одна вещь, я также пытаюсь установить LXML (он сказал, не удалось найти vcvarsall.bat), но не слишком. Так что, не много инструментов, я могу использовать.
from bs4 import BeautifulSoup
import urllib.request
def open_html():
resp = urllib.request.urlopen("http://www.gpsbasecamp.com/national-parks")
soup = BeautifulSoup(resp, from_encoding=resp.info().get_param('charset'))
for link in soup.find_all('a', href=True):
print(link['href'])
if __name__ == '__main__':
open_html()
Какие шаги вы предприняли для обновления BeautifulSoup до версии 4.5.1? Возможно, старая версия все еще присутствует? –
запустите 'pip list'. is Beautifulsoup4, перечисленные –