TypeError: ожидаемая строка или байтоподобный объект

Я написал файл script, чтобы разобрать html и распечатать только текстовое содержимое. Я хотел игнорировать теги. Но у моей программы есть проблема. Я не уверен, что это такое. Пожалуйста, помогите мне.TypeError: ожидаемая строка или байтоподобный объект

import urllib.request 
import re 
from bs4 import BeautifulSoup 
url = "www.example.com" 

def hi(): 
    dep = urllib.request.urlopen(url) 
    soup = BeautifulSoup(dep, 'html.parser') 
    for link in soup.find_all('p', string=True): 
     result = re.sub(b'<.*?>', "", link) 
     print (result) 
hi()

Сайт link.

источник

2016-03-11 Vasanth Prabakar

добавить код здесь. –

и обязательно включите полную трассировку в виде текста и то, что вы пытались решить проблему. – timgeb

@ Vasanth опубликуйте код, а не URL, который вы пытались очистить. –

Я считаю, что у вас есть NavigableString в link переменная.

Force брось в строку, как:

for link in soup.find_all('p', string=True): 
    result = re.sub(b'<.*?>', "", str(link)) 
    print (result)

источник

2016-03-12 14:51:56

Но теперь он показывает мне TypeError: не может использовать шаблон байта на подобном строке объекте. –

изменить 'b '<.*?>'' to 'r '<.*?>''. –

Урайийы ... Большое вам спасибо. Вы можете объяснить эту строку? потому что я скопировал эту строку из другого кода. Я не знаю, что такое логика :) –

TypeError: ожидаемая строка или байтоподобный объект

ответ

Смежные вопросы