Я хотел бы напечатать Emojis из питона (3) ЦСИPython3 ГКЗ кодировки Emojis
Я работаю над проектом, который анализирует Facebook Message histories и в файле сырых данных HTM скачал я нахожу много emojis отображаются как поля с вопросительными знаками, как это происходит, когда значение не отображается. Если я скопирую эти символы в терминал как строки, я получаю такие значения, как \U000fe328
. Это также вывод, который я получаю, когда я запускаю htm-файлы через BeautifulSoup и вывод данных.
I Googled эта строка (и другие), и последовательно один из единственных сайтов, которые приходят с ними, - iemoji.com, в случае строки выше this page, которая перечисляет строку как Python Src. Я хочу, чтобы иметь возможность распечатывать эти строки в качестве их соответствующих emojis (в конце концов, они были оригинально emojis при обмене сообщениями), и после осмотра я обнаружил сопоставление src-кодировок at this page, которые отображали приведенные выше строки как имена строк emoji , Затем я нашел список this emoji string names to Unicode, который по большей части, похоже, отображает имена emoji в Unicode. Если я попробую распечатать эти значения, я получаю хороший результат. Как следующего
>>> print(u'\U0001F624')
Есть ли способ, чтобы отобразить эти «Python» ГНЦ кодировки в их значение Юникода? Связывание обеих библиотек будет работать, если не для того, чтобы исходное сопоставление src отсутствовало около 50% значений unicode, найденных в библиотеке юникода. И если мне все-таки придется это сделать, есть ли хороший способ найти значение Python Src данного эмози? Из моего тестирования emoji, как строки, равны их Unicode, например '' == u'\U0001F624'
, но я никак не могу получить какие-либо отношения к \U000fe328
'u '\ U0001F624'' ==' ''', который является персонажем частного использования. Я предполагаю, что Facebook messenger использует это как emoji, который не определен в стандарте Unicode. – roeland
Но должна быть какая-то система? Почти каждый из кодировок Src или персонажей частного использования ссылался на emoji на iemoji.om. Есть ли способ автоматизировать получение этой информации без соскабливания сайта? –