Я просматриваю PDF-файл, который я преобразовал его содержимое в строки, и есть много вхождений символа \ *** (* означает любой символ), происходящего внутри слов. Например:Как удалить вхождения *** в строке
сделки, золотая середина казалась работоспособной \ XE2 \ x80 \ x94norms четко сформулированы, подкрепленные санкциями соответствующих профессиональных ассоциаций
Использование text.replace("\\***","")
явно не работает, и поэтому я был глядя на использование re.sub()
.
У меня возникли проблемы с синтаксисом (выражения reg), чтобы внести в аргументы и надеялся на какую-то помощь в этом.
Является '*' буквально звездочка или просто какой-нибудь символ? – DyZ
Вы пробовали 'text.replace (" \\ *** "," ")'? – fafl
* означает любой символ @DYZ – borrimorri