Я лично всегда использовать UTF-8. Он хорошо поддерживается, и каждый язык, ОС и браузер каким-то образом его поддерживают. Объекты приятно отображать, но они - боль в шее для редактирования. Именованные объекты могут ссылаться на множество символов, но будут охватывать только западные наборы символов. Для азиатских языков вам придется вернуться к шестнадцатеричным объектам, и это не так. Шестнадцатеричные сущности также должны быть декодированы или закодированы с использованием таблиц Unicode в любом случае, поэтому вы можете использовать юникодный вкус для кодирования текста в первую очередь.
Если ваша основная аудитория - английский, вы можете подумать, что можете справиться с ISO-8859-1 или cp1252, но это было бы ошибкой. Рано или поздно кто-то собирается писать акцентированные или другие иностранные символы, и когда это произойдет, слишком поздно исправить вашу кодировку: какой-то текст уже запутан.
Вот куча дальнейшего чтения, которые спасли меня много головной боли, когда играя с кодировками:
Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) ли подробное введение наборов символов и их использования и разностью joelonsoftware.com. Информация там довольно общая, но полезно помочь выяснить, какую кодировку выбрать.
Character sets from Browser to Database - очень практичная и прагматичная статья из SUN, в которой много говорится о различных местах, где вы должны убедиться, что ваша кодировка не преобразована ни в что другое.
What Is UTF-8 And Why Is It Important? - это еще одна статья от SUN, которая углубляется в nitty gritty UTF-8 и должна быть разрешена для ответа на любой интересующий вас вопрос по деталям UTF-8 после прочтения первых 2 статей.
Мне нравится, как этот звук звучит как вопрос экзамена ... НЕ – hop