2015-01-14 2 views
1

У меня есть веб-гусеничный движок, который запускается на разных сайтах (в данном случае китайский).Кодировка китайского символа (UTF-8, GBK)

Теперь, когда я извлекаю данные и показываю их на своем веб-сайте, китайские персонажи все превращаются в мусор. Я прочитал о кодировке символов, и я узнал, что UTF-8, как правило, является лучшим кодированием.

Теперь проблема в том, что я использую UTF-8. Данные, сканированные с WEBSITE-1, отображаются правильно, но не для WEBSITE-2.

Для ВЕБ-САЙТА-2 кодировка символов gb18030 работает правильно.

Мой вопрос в том, есть ли способ узнать кодировку символов для веб-сайта, чтобы я мог создать общее решение? Я имею в виду, что я могу отобразить страницу на своем локальном веб-сайте, зная, какую кодировку символов использовать. Таким образом, я могу закодировать в бэкэнд и не беспокоиться о том, что требуется для открытия страницы.

Сейчас у меня есть две страницы, 1 для китайских символов UTF-8 и одна для китайских символов GB18030.

+0

вам нужно определить, какие страницы говорят, что их кодирование, есть алгоритм для этого в спецификации HTML5 – Mgetz

ответ

0

Используйте HTML мета тег «Content-Type» для HTML < 5 или мета-тег «полукокса-набор» для HTML 5

W3schools charset

Смежные вопросы