2016-09-15 1 views
0

Я пытаюсь получить шведский контент с другого сайта. Я могу получить данные, но символы Швеции (ÅÖÄ) отсутствуют. Шведский контент, который я добавил напрямую, не имеет проблем для отображения, так как я добавил метатег. Проблема в том, что я пытаюсь отобразить данные с другого сайта. Можно ли исправить эту проблему. У меня нет доступа к другому сайту.Шведские символы отсутствуют при отображении на html-форме

+0

ваш сайт не использует ту же кодировку другого сайта. это не проблема html. добавьте больше информации о том, что вы делаете – Wes

+1

как вы пытаетесь получить эти данные? Вы не указали код того, что вы пытаетесь выполнить. – mlegg

ответ

1

Чтобы принять во внимание шведских символов, вам необходимо установить charset в UTF-8. Пример из MDN является:

<!-- In HTML5 --> 
<meta charset="utf-8"> 

<!-- Defining the charset in HTML4 --> 
<!-- Note: This is invalid in HTML5 --> 
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 

Метатег идет в <head> тег как так:

<html> 
    <head> 
    <meta charset="UTF-8"> 
    </head> 
</html> 

Цитирую MDN:

[кодировка] объявляет кодировку символов, используемую страницы. Он может быть локально переопределен с использованием атрибута lang для любого элемента. Этот атрибут является литеральной строкой и должен быть одним из предпочтительных имен MIME для кодировки символов, определенной в IANA. Хотя стандарт не запрашивает определенную кодировку, это дает некоторые рекомендации:

  • Авторам рекомендуется использовать UTF-8.
  • Авторы не должны использовать ASCII-несовместимые кодировки (то есть те, которые не отображают 8-битный код указывает на 0x20 0x7E в Unicode 0x0020 до 0x007E кодовых точек), поскольку они представляют угрозу безопасности: браузер не поддерживает их может интерпретировать доброкачественное содержимое как HTML Элементы. Это касается, по меньшей мере, следующих кодировок: JIS_C6226-1983, JIS_X0212-1990, HZ-GB-2312, JOHAB, семейства ISO-2022 и семейства EBCDIC.
  • Авторы не должны использовать CESU-8, UTF-7, BOCU-1 и SCSU, также попадающие в эту категорию и не предназначенные для использования в Интернете. Атаки с использованием нескольких скриптов с некоторыми из этих кодировок были зафиксированы в .
  • Авторы не должны использовать UTF-32, поскольку не все алгоритмы кодирования HTML5 могут отличить его от UTF-16.

Here также ссылка на UTF-8.

* Примечание: если по какой-то причине UTF-8 кодировка не работает для ваших персонажей, попробуйте charset="ISO-8859-1"

+0

«установить кодировку в UTF-8»: не совсем, charset _documents_ набор символов и кодировка, используемые документом. Он должен быть установлен таким, каким бы он ни был. Если документ сгенерирован или сохранен библиотекой, он установит это значение на основе кодировки, используемой для сохранения файла. Но, да, если вы используете текстовый редактор, сохраните его как UTF-8 после ввода UTF-8 в тег. –

Смежные вопросы