Можно создать дубликат:
What is the best way to remove accents in a python unicode string?
Python and character normalizationудаления акцент и специальные символы
Я хотел бы удалить акценты, превратить все символы в нижнем регистре, а также удалять любые цифры и специальные символы.
Пример:
Frédér8ic @ -> Frederic
Предложение:
def remove_accents(data):
return ''.join(x for x in unicodedata.normalize('NFKD', data) if \
unicodedata.category(x)[0] == 'L').lower()
Есть ли лучший способ сделать это?
Не могли бы вы отредактировать свой ответ, чтобы включить некоторые примеры желаемого ввода и вывода? –
@Christian Jonassen Frédér8ic @ -> frederic @@ àbcd -> abcd% * tréçd -> trecd – Fred
Я использую python 3.x – Fred