Я начинаю использовать Python (я использую 3.4). Это важная часть моего кода.UnicodeDecodeError при чтении текстового файла
fileObject = open("countable nouns raw.txt", "rt")
bigString = fileObject.read()
fileObject.close()
Всякий раз, когда я пытаюсь прочитать этот файл я получаю:
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 82273: character maps to <undefined>
Я читал вокруг и, кажется, что-то делать с моей кодировки по умолчанию не соответствует кодировке текстового файла. Я прочитал в другом посте, что вы можете использовать этот метод для чтения файла с конкретной кодировки:
import codecs
f = codecs.open("file.txt", "r", "utf-8")
Но вы должны знать это заранее. Дело в том, что я не знаю, как закодирован текстовый файл. Несколько советов, предложенных с использованием Chardet. Я установил его, но я понятия не имею, как заставить его читать текстовый файл.
Любые идеи о том, как обойти это?
Есть ли файл на окнах? –
Я так не думаю.Возможно, [Cygwin] (https://www.cygwin.com/) включает его. –