У меня есть веб-гусеничный движок, который запускается на разных сайтах (в данном случае китайский).Кодировка китайского символа (UTF-8, GBK)
Теперь, когда я извлекаю данные и показываю их на своем веб-сайте, китайские персонажи все превращаются в мусор. Я прочитал о кодировке символов, и я узнал, что UTF-8, как правило, является лучшим кодированием.
Теперь проблема в том, что я использую UTF-8. Данные, сканированные с WEBSITE-1, отображаются правильно, но не для WEBSITE-2.
Для ВЕБ-САЙТА-2 кодировка символов gb18030 работает правильно.
Мой вопрос в том, есть ли способ узнать кодировку символов для веб-сайта, чтобы я мог создать общее решение? Я имею в виду, что я могу отобразить страницу на своем локальном веб-сайте, зная, какую кодировку символов использовать. Таким образом, я могу закодировать в бэкэнд и не беспокоиться о том, что требуется для открытия страницы.
Сейчас у меня есть две страницы, 1 для китайских символов UTF-8 и одна для китайских символов GB18030.
вам нужно определить, какие страницы говорят, что их кодирование, есть алгоритм для этого в спецификации HTML5 – Mgetz