2015-11-06 3 views
0

При чтении файла нужно ли мне рассматривать единую кодировку?При чтении файла мне нужно рассмотреть одну кодировку?

Здесь Идея проста, каждый файл поддерживается только одним кодированием, и это база данных на основе данных, доступных в файле.

Различные кодировки, как ..ASCII, UTF-8, UTF-16, ISO ** и т.д.

Большинство случае, мы рассмотрели и прочитать файл, используя только одного кодировку UTF-8, но некоторые сложные символы являются не поддерживается для этой кодировки, и в этом случае мы получаем символ мусора или ошибки.

Как вы прочитали файл?

+0

Все символы Юникода поддерживаются UTF-8, но если файл использует другую кодировку, вы, конечно, можете получить тарабарщину. Вам нужно использовать правильную кодировку для каждого файла. Если у вас есть контроль над написанием файлов, вы можете использовать UTF-8 для всего. – Cinnam

ответ

0

Ваше мнение о том, что файл имеет единственную кодировку, неверен. См. Символьный набор и кодировка символов - это две разные вещи. Вы можете сказать, что файл содержит символы из заданного набора символов, такие как ASCII (печатные символы, некоторые непечатаемые и управляющие символы), но как эти символы будут представлены, определяется кодировкой символов. Таким образом, файл, содержащий набор символов ASCII, может быть закодирован с использованием ASCII, UTF-8, UTF-16 и т. Д. Просто откройте текстовый файл в блокноте ++ и зайдите в меню «Кодировка». Вы увидите различные пункты меню, доступные для просмотра файла в разных кодировках.

Надеюсь, это поможет вам.

Смежные вопросы