Я пытаюсь удалить список знаков препинания из своего текстового файла, но у меня есть только одна проблема со словами, отделенными от дефиса. Например, если у меня есть слово «посттравма», я получаю «посттраму», наоборот, я хочу получить «пост» «травму».Python удаляет пунктуацию из текстового файла
Мой код:
punct=['!', '#', '"', '%', '$', '&', ')', '(', '+', '*', '-']
with open(myFile, "r") as f:
text= f.read()
remove = '|'.join(REMOVE_LIST) #list of word to remove
regex = re.compile(r'('+remove+r')', flags=re.IGNORECASE)
out = regex.sub("", text)
delta= " ".join(out.split())
txt = "".join(c for c in delta if c not in punct)
Есть ли способ решить эту проблему?
Вы должны использовать регулярное выражение, в котором вы не хотите [a-zA-Z]. * - [az] быть удаленным – kulssaka
Просто выкинув это, вы пробовали = regex.sub ("", text)? – tnknepp