Когда я сохраняю текстовый документ в UTF-8, который в основном говорит: «Компьютер, используйте кодировку для UTF8, которая установлена где-то на вашем компьютере, чтобы выяснить, как превратить символы 1 и 0 в символы, правильно?понимание различных кодировок символов
Когда я сохранить это содержание:
激光
äüß
#§
в ISO-8895-1, он становится это (на Linux, используя редактор Kate):
æ¿å
äüÃ
#§
Что не отображается в том, что в первой и второй строке, которые представляют собой некоторые странные квадраты, отображаемые вместо символов (их можно увидеть в инструментах разработчика).
Итак, я понимаю, что это означает, что комбинация 0 и 1, представляющих 激 в utf-8, сопоставляется с æ в ISO-8895-1, правильно? И странные квадраты> < происходят из-за отсутствия сопоставления для этого двоичного числа в наборе символов ISO-8895-1, поэтому компьютер по умолчанию использует некоторую другую кодировку.
Верно ли это?
[Абсолютный минимум Каждый разработчик программного обеспечения Абсолютно, положительно должен знать об Unicode и наборах символов (без оправданий!)] (Http://www.joelonsoftware.com/articles/Unicode.html) –
Спасибо, я уже читал это, но я все еще не был на 100% уверен, что получил это. – user3813234