Я просмотрел все вокруг и нашел решения для python 2.6 и ранее, НИЧЕГО, как это сделать в python 3.X. (У меня есть доступ только к коробке Win7.)Как удалить объекты HTML в строке в Python 3.1?
Я должен иметь возможность сделать это в версии 3.1 и желательно без внешних библиотек. В настоящее время у меня установлен httplib2 и доступ к командной строке curl (вот как я получаю исходный код для страниц). К сожалению, curl не расшифровывает html-сущности, насколько я знаю, я не смог найти команду для его декодирования в документации.
ДА, Я попытался заставить Красивый суп работать, МНОГО ВРЕМЕНИ без успеха в 3.X. Если бы вы могли предоставить инструкции EXPLICIT о том, как заставить его работать на python 3 в среде MS Windows, я был бы очень благодарен.
Итак, чтобы быть ясным, мне нужно повернуть строки следующим образом: Suzy & John
в строку типа «Suzy & John».
Awesome! Тем не менее, я вижу, что только отменяет определенные символы. Например, амперсанд остается скрытым. Не могли бы вы объяснить, почему это? Как отключить эти символы? –
@Sho Minamimoto: Я добавил пример. Надеюсь, поможет? – unutbu
Да, я понял, спасибо! –