Это действительно запутанно обрабатывать не-ascii код char в python. Может ли кто-нибудь объяснить?дескриптор строки без ascii в python
Я пытаюсь прочитать простой текстовый файл и заменить все неалфавитные символы пробелами.
У меня есть список символов:
ignorelist = ('!', '-', '_', '(', ')', ',', '.', ':', ';', '"', '\'', '?', '#', '@', '$', '^', '&', '*', '+', '=', '{', '}', '[', ']', '\\', '|', '<', '>', '/', u'—')
для каждого маркера я получил, я заменить любой символ в этом знак с пространством, вызвав
for punc in ignorelist:
token = token.replace(punc, ' ')
уведомление есть не ASCII код символа в конец ignorelist
: u'—'
Каждый раз, когда мой код встречает этот персонаж, он падает и говорит:
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position
Я попытался объявить кодировку, добавив # -*- coding: utf-8 -*-
в начало файла, но все еще не работает. кто знает почему? Благодаря!
Спасибо, что работает! – bolei
Я бы хотел вас поддержать. но мой счет меньше 15, и я не могу голосовать ... извините за это! – bolei