Я работаю над веб-сайтом с системой управления контентом, которая плохо работает с отображением любого текста с символами, отличными от ASCII. Например, правые одиночные кавычки отображаются как на следующей веб-странице (это просто пример, а не от CMS-ведомой веб-сайт):Использование JavaScript для исправления плохо кодированных символов Юникода?
http://www.gregboettcher.com/cmsunicode.html
Я не могу контролировать внутреннюю работу CMS, но все же я хотел бы как-то попытаться исправить этот глюк.
Я попытался возиться с определением страницы с кодировкой, но изменение ее с UTF-8 на ANSI или UCS-2 просто усугубило ситуацию.
Вот мой главный вопрос: Может ли JavaScript использоваться, чтобы каким-то образом найти кодированные символы Unicode и отобразить их правильно?
Я ухватился за соломинку здесь. Огромное спасибо всем, кто может помочь.
Отредактирована 12 июня:
Для всех, кто ответил, спасибо за предоставленные некоторые полезные ответы на довольно расплывчатый вопрос.
Я изучил это еще немного, и похоже, что CMS пишет UTF-8 в базу данных, но затем читает его из базы данных с ожиданием чего-то другого, кроме UTF-8 (хотя тогда создает веб-страницы, которые говорят «charset = UTF-8»).
Я согласен, что было бы лучше попытаться исправить это, предотвратив запись не-ASCII-символов в базу данных, но с помощью CMS, которую я использую, это не очень практично.
Я сказал моему руководителю, что мы все еще можем использовать JavaScript, чтобы устранить проблему на стороне клиента, но когда я объяснил, что это будет связано, он сказал мне не беспокоить. Кажется, он доволен, понимая, что вызывает проблему, и пересылает ошибку разработчикам CMS.
Так что спасибо - я кое-что узнал о кодировке текста и JavaScript.
Похоже, что текст может быть как-то сломан в пути * в * системе. Я не знаю, как код на стороне клиента будет знать, что ему нужно исправить, а тем более что он должен изменить любые сломанные символы. – Pointy