При чтении файла мне нужно рассмотреть одну кодировку?

При чтении файла нужно ли мне рассматривать единую кодировку?При чтении файла мне нужно рассмотреть одну кодировку?

Здесь Идея проста, каждый файл поддерживается только одним кодированием, и это база данных на основе данных, доступных в файле.

Различные кодировки, как ..ASCII, UTF-8, UTF-16, ISO ** и т.д.

Большинство случае, мы рассмотрели и прочитать файл, используя только одного кодировку UTF-8, но некоторые сложные символы являются не поддерживается для этой кодировки, и в этом случае мы получаем символ мусора или ошибки.

Как вы прочитали файл?

источник

2015-11-06 javaamtho

Все символы Юникода поддерживаются UTF-8, но если файл использует другую кодировку, вы, конечно, можете получить тарабарщину. Вам нужно использовать правильную кодировку для каждого файла. Если у вас есть контроль над написанием файлов, вы можете использовать UTF-8 для всего. – Cinnam

Ваше мнение о том, что файл имеет единственную кодировку, неверен. См. Символьный набор и кодировка символов - это две разные вещи. Вы можете сказать, что файл содержит символы из заданного набора символов, такие как ASCII (печатные символы, некоторые непечатаемые и управляющие символы), но как эти символы будут представлены, определяется кодировкой символов. Таким образом, файл, содержащий набор символов ASCII, может быть закодирован с использованием ASCII, UTF-8, UTF-16 и т. Д. Просто откройте текстовый файл в блокноте ++ и зайдите в меню «Кодировка». Вы увидите различные пункты меню, доступные для просмотра файла в разных кодировках.

Надеюсь, это поможет вам.

источник

2015-11-06 08:01:07

При чтении файла мне нужно рассмотреть одну кодировку?

ответ

Смежные вопросы