13

У меня есть txt-файл для разговора, экспортированный из WhatsApp. WhatsApp поддерживает смайлики в их разговоре, а экспортированный разговор также, к моему удивлению, содержит эти смайлики! То есть, если я открываю текстовый файл в текстовом редакторе (Text Wrangler на Mac 10.8), я могу видеть смайлики. Текстовый файл закодирован в UTF-8, и нет ресурсов, связанных с файлом, который я могу сказать.специальные символы (смайлики) в текстовом файле

Может ли кто-нибудь объяснить мне, как эти смайлики включены в текстовый файл и как они точно интерпретируются текстовым редактором? Связано ли это с кодировкой символов? Включены ли дополнительные ресурсы в текстовый файл?

ответ

21

Юникод содержит разделы, которые определяют emoji как «символы». Они обычные персонажи, вам нужен только шрифт, который может отображать их. Также смотрите Unicode Emoji FAQ.

В текстовом файле символы в основном кодируются как числа в виде байтов. Чтобы отобразить эти визуально на экране компьютера, вам нужен шрифт , который содержит визуальный глиф для рендеринга этого персонажа. Поскольку процесс всегда числовой идентификатор → шрифт → видимый глиф, должно быть довольно очевидно, что «персонаж» может быть визуальным, в том числе эможи или любым другим изображением.

character viewer

+1

Приятное объяснение. Я бы добавил, что, когда смайлики кодируются с использованием стандартных кодов Unicode, например U + 1F600, вы можете использовать любой шрифт, который их содержит. Иногда используются специальные URL-адреса Private Use, а затем вам нужен очень специфический шрифт, который содержит смайлики в этих «конфиденциальных согласованных» кодовых точках. –

+1

несколько способов улучшить этот ответ: 1) где вы получили этот график? 2) пример использования этой диаграммы для вставки символа emoji / – ahnbizcad

Смежные вопросы