Я обрабатываю HTML с использованием библиотеки Python и BeautifulSoup 4, и я не могу найти очевидный способ заменить
пробелом. Вместо этого он, похоже, преобразуется в неразрывный пробельный символ Unicode.Как заменить или удалить объекты HTML, такие как « » с помощью BeautifulSoup 4
Я пропустил что-то очевидное? Какой лучший способ заменить & nbsp; с нормальным пространством с помощью BeautifulSoup?
Изменить, чтобы добавить, что я использую последнюю версию, BeautifulSoup 4, поэтому опция convertEntities=BeautifulSoup.HTML_ENTITIES
в Beautiful Soup 3 недоступна.
Но это * неиспользуемое пространство ... –
Да, я понимаю, что - это неразрывное пространство. Итак, вы говорите, что нужно сделать, чтобы получить фрагмент HTML, который я хочу, а затем запустить поиск в Unicode и заменить его? Я думаю, что делает то, что я хочу, я просто подумал, что есть эквивалент старой опции convertEntities. –