Я пытаюсь разобрать веб-сайт, и я собираюсь использовать его позже в своем проекте Django. Для этого я использую urllib2 и BeautifulSoup4. Однако я не мог получить то, что хочу. Вывод объекта BeautifulSoup является странным. Я пробовал разные страницы, он работал (выход нормальный). Я думал, что это из-за страницы. Затем, когда мой друг попытался сделать то же самое, он получил нормальную производительность. Я не мог понять проблему.BeautifulSoup soup.prettify() дает странный вывод
Это website Я собираюсь разобрать.
Это пример странного вывода после команды «soup.prettify()»:
t d B G C O L O R = " # 9 9 0 4 0 4 " w i d t h = " 3 " > i m g S R C = " 1 p . g i f " A L T B O R D E R = " 0 " h e i g h t = " 1 " w i d t h = " 3 " > / t d > \n / t r > \n t r > \n t d c o l s p a n = " 3 " B G C O L O R = " # 9 9 0 4 0 4 " w i d t h = " 6 0 0 " h e i g h t = " 3 " > i m g s r c = " 1 p . g i f " w i d t h = " 6 0 0 " \n h e i g h t = " 1 " > / t d > \n / t r > \n / t a b l e > \n / c e n t e r > / d i v > \n \n p > &n b s p ; &n b s p ; &n b s p ; &n b s p ; / p > \n / b o d y > \n / h t m l >\n </p>\n </body>\n</html>'
Можете ли вы опубликовать код, который вы использовали? –
Это похоже на то, что написал @Hooked. Вот что я использовал: импорт urllib2 из BS4 импорта BeautifulSoup страница = urllib2.open ("http://kafemud.bilkent.edu.tr/monu_tr.html") суп = BeautifulSoup (страница) печати soup.prettify() – aburak