Я пытаюсь создать веб-страницу на китайском языке, и я понял, что, хотя текст выглядит отлично, когда я запускаю его в браузерах, как только я меняю кодировку символов, текст становится тарабарщиной. Вот что происходит:Вопросы по китайскому кодированию
- Я создаю свой html-файл в Emacs, закодированном в UTF-8.
- Я загружаю его на сервер и просматриваю его в своих браузерах (FF, IE, Chrome, Opera) - без проблем.
- Я пытаюсь просмотреть страницу в других кодировках через FF> Вид> Кодировка символов> Все эти различные китайские системы кодирования, например. Chinese Simplified (HZ)
- Помимо UTF-8, при любой другой кодировке текст становится тарабарщиной.
Я предполагаю, что это не проблема - то есть браузеры достаточно умны, чтобы знать, в какую кодировку находится страница, и точно разбирать контент. Мне интересно, почему я не могу читать китайский текст больше, когда меняю кодировку - это потому, что у меня нет китайских шрифтов, установленных на моей ОС? Должен ли я придерживаться UTF-8, если моя аудитория китайская или я должен выбрать одну из своих многочисленных систем кодирования?
Заранее за вашу помощь/мнение.
Повторно введите текст? Вы говорите, что я должен создавать отдельные файлы, каждый из которых написан и сохранен с другой кодировкой? Тогда как я могу решить, какой файл служить? – anthonytwp
Да, но вы должны следовать совету Agent_L и определять кодировку кодировки в HTML, что позволит сэкономить гораздо больше времени. Если вам нужны отдельные файлы, должно быть возможно написать сценарий для автоматической кодировки UTF-8 для каждой другой кодировки, которая должна поддерживаться, но думать вперед, имея несколько копий одного и того же содержимого, может стать проблемой обслуживания. – MHTri
Я считаю, что он имел в виду ситуацию, когда клиент запрашивает файл и явно требует его в какой-то другой кодировке. Хотя это возможно, маловероятно, что современный браузер не поддерживает utf-8 (к моим предвзятым знаниям eu/us). –