Я не знаю, был ли задан этот вопрос раньше, но я не мог найти ничего, что могло бы помочь решить мою проблему (надеюсь, я ничего не понял). Я изучаю Python в данный момент, используя Python 3.5 с IPython, и у меня возникли проблемы с использованием BeautifulSoup. Как показано ниже,BeautifulSoup возвращает пустую строку?
import bs4
exampleFile = open('example.html')
exampleFile.read()
>>> '<html><head><title>The Website Title</title></head>\n<body>\n<p>Download my <strong>Python</strong> book from <a href=“http://inventwithpython.com”>my website</a>.</p>\n<p class=“slogan”>Learn Python the easy way!</p>\n<p>By <span id=“author”>Al Sweigart</span></p>\n</body></html>'
exampleSoup = bs4.BeautifulSoup(exampleFile.read(), 'html.parser')
exampleFile.read()
>>> ''
elems = exampleSoup.select('#author')
print(elems)
>>> []
Я могу открыть и прочитать example.html, но после того, как я использую BeautifulSoup, когда я пытаюсь снова прочитать файл, он возвращает пустую строку. Из-за этого я не могу определить элем.
Я пытаюсь понять, почему это происходит, но я не мог понять это, поэтому решил отправить вопрос.
Заранее благодарен!
Я обновил свой код, чтобы он выглядел как код Керри Хэтчера, но print (exampleSoup) по-прежнему ничего не возвращает, даже пустой список. – mdlee6