У меня есть текстовый файл, содержащий некоторые двоичные данные. Когда я прочитал файл, используя Python 3, в текстовом режиме я получаю UnicodeDecodeError (кодек не может декодировать байт ...) со следующими строками кода:вырезать двоичные данные из текстового файла в python
fo = open('myfile.txt, 'r')
for line in inFile:
Как я могу удалить двоичные данные мой файл. У меня есть заголовок, который печатается непосредственно перед каждым двоичным данным (в этом случае он отображается как Блок данных). Например, мой файл выглядит, например, где я хочу, чтобы удалить çºí ¼È × «NDI:
myfile.txt:
ABCDEFGH
123456
Data Block 11
çºí?¼Èדñdí
XYZ123
Результат я хочу для myfile.txt, чтобы выглядеть следующим образом:
ABCDEFGH
123456
Data Block 11
XYZ123
Весь текст является двоичным, на самом деле. Было бы странно иметь случайные бинарные капли, смешанные с текстом. Может быть, вы просто пытаетесь прочитать файл с неправильной кодировкой? Может быть, эти части являются «чужими» словами? – deceze
Да, я согласен, что это странно, но эти файлы фактически содержат случайные бинарные капли. – SSS
Вы используете Python 2 или 3? – jedwards