Короткий ответ заключается в том, что, используя подход, который вы имеете в виду в варианте 1, поисковые системы будут видеть слово «საქართველო» в вашем тексте как «saqarTvelo», поэтому обычные поисковые запросы будут терпеть неудачу.
Вопрос, кажется, относятся к двум различным способам использования грузинских писем на веб-страницах:
- Использование кодировки Unicode, так что символы будут предоставляться с использованием Unicode-закодированный шрифт (который является то, что большинство шрифтов , но большинство шрифтов не содержат грузинских букв).
- Использование нестандартной «частной» кодировки, обычно такой, которая отображает 256 различных позиций кода (8-битные комбинации) для любых символов, необходимых для некоторых целей. Это предполагает, что текст визуализируется с использованием шрифта, закодированного таким же образом.
Метод 2 можно охарактеризовать как wrong approach, но он был использован в Интернете с первых дней (даже если CSS не был доступен, и один пришлось прибегнуть к <font face=...>
для установки шрифта), и особенно в Первые дни. Это действительно не работает, если компьютер пользователя не имеет специфического «конфиденциального» кодированного шрифта (или какой-то шрифт кодируется точно так же). Поскольку поисковые системы не зависят от шрифтов, они видят только 8-битные коды и пытаются интерпретировать их в кодировке, объявленной или подразумеваемой для этой страницы, а не в «частной» кодировке (которая не может быть объявлена, поскольку она не имеет опубликованного определения и нет стандартного имени или какого-либо имени в этом отношении).
У метода 1 есть проблема, что для его работы компьютер пользователя должен иметь (шрифт с кодировкой в Юникоде), который поддерживает используемые символы. В настоящее время это может быть достаточно хорошо разрешено с помощью загружаемого шрифта (веб-шрифта) через @font-face
. Fonts that support Georgian letters включают некоторые полезные бесплатные шрифты, такие как шрифты DejaVu, шрифты GNU Freefont и Quivira. Для получения дополнительной информации об этом подходе см. Мой Guide to using special characters in HTML.
Используя метод 1, поисковые системы будут правильно видеть грузинские буквы, если кодировка документа (обычно UTF-8) была правильно объявлена или может быть определена поисковой системой.
Грузинский не имеет «своего Юникода». Существует только * один * Юникод (ключ в имени!), И он одинаковый для всех. –
@ Kerrek SB, что вы имеете в виду? если я хочу найти слово «საქართველო», будет ли Google показывать мой сайт? даже если есть только слово «saqarTvelo», которое является словом «საქართველო», но только с шрифтом. – Irakli
@ KerrekSB: Это не помогает понять его слабое владение английским языком.Его проблема подобна проблемам со старыми шрифтами «Символ» и «Дингбаты», которые повторно используют диапазон ASCII для других символов. Это было очень распространено только для языка, который не использует латинский скрипт до тех пор, пока Unicode не получит признание. – hippietrail