в затмении, у меня есть файл, где какое-то место это написано:понимание кодировки файлов
onclick='obj1.help_open_new_window(fn1(), "/redir/url_name")'
и в затмении Edit меню-> набор кодирования, я вижу это:
Теперь я меняю кодировку на UTF-8 с использованием того же диалогового окна, и текст изменяется на:
onclick='obj1.help_open_new_window(fn1(),�"/redir/url_name")'
Все, что я знаю, если этого не происходит, тогда мой сайт будет работать нормально. Почему это происходит и что я делаю, чтобы предотвратить это?
У меня есть некоторые сведения о кодировках: Â and nbsp mystery explainedThe Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!), но все же я не понимаю, почему это происходит. Не стесняйтесь перейти на уровень байтов (как файл сохраняется), чтобы объяснить это.
UPDATE: Вот что я понимаю: если файл закодирован в latin-1
, то каждый символ является байт и поэтому является . это должно быть
hex(32)
. теперь, когда я конвертирую его в utf-8, он по-прежнему остается hex(32)
, и это определенно . это приводит меня к мысли, что в латинском-1
не
hex(32)
, а комбинация из двух байтов. Как это возможно?
Если вы можете, откройте файл с помощью шестнадцатеричного редактора, чтобы узнать, какие байты фактически хранятся в файле в этой точке. – AKX