Мне нужно расшифровать электронную почту, сохраненную из Outlook, только как текст. К сожалению, они не соответствуют стандарту ISO-8859-1, поскольку в них содержатся специальные символы «умной цитаты». Имеет ли кодовая страница, используемая Outlook, настоящее имя (которое я могу передать unicode.decode() в Python), или это просто какая-то произвольная глупость, которую мне придется вручную декодировать? И если да, то у кого есть ссылка на все «специальные» символы, добавленные Microsoft?Какая кодировка использует Outlook для текстовых сообщений?
ответ
Вполне вероятно, что Outlook сохранит сообщения в вашем текущем регионе. Мое предположение было бы Windows-1252.
Nitpick: То, что вы называете «умными кавычками», на самом деле должно выглядеть так, как должны выглядеть кавычки. Кавычки, которые вы использовали в своем сообщении, известны как «пишущие машинки»; для механических пишущих машинок количество ключей было основным фактором стоимости и котировками, которые выглядят очень похожими друг на друга, а символ «дюйм» объединен в один ключ, эстетика будет проклята.
Вы правы, они в Windows-1252. Благодарю. –
Это, кстати, «cp1252» в Python. –
Существует много (зависит от региона) Windows code pages, поэтому, возможно, в худшем случае это зависит от страны, в которой находится отправитель.
Я могу предположить, что все сообщения будут из локалей США или Великобритании. Похоже, Windows-1252 - это правильная кодировка, спасибо. –
- 1. Какая кодировка использует std :: string.c_str()?
- 2. Python: какая кодировка использует «печать»?
- 3. Какая кодировка использует System.Windows.Forms.RichTextBox для символов Unicode?
- 4. Какая кодировка использует FileIO.WriteTextAsync (файл, текст)?
- 5. Какая кодировка использует обычные строки python?
- 6. Какая кодировка использует SSIS для вывода плоских файлов в Unicode?
- 7. PHP - Какая кодировка использует mcrypt для зашифрованной строки?
- 8. Какая кодировка Java использует для создания строки из данных unicode?
- 9. Какая кодировка?
- 10. Какая минимальная кодировка для URL?
- 11. Какая кодировка кодировки для API
- 12. Какая кодировка символов для использования
- 13. Какая кодировка использует Java UTF-8 или UTF-16?
- 14. Какая кодировка требует posFlag?
- 15. Какая правильная кодировка для типа SNMP Unsigned32?
- 16. Какая кодировка ожидает xsendfile?
- 17. Какая кодировка URL это?
- 18. Какая кодировка содержимого использует сценарий CGI Perl по умолчанию?
- 19. Какая кодировка символов использует 2 символа подчеркивания и букву?
- 20. Какая кодировка используется протоколом HTTP?
- 21. Какая более эффективная кодировка?
- 22. Что такое кодировка по умолчанию/кодировка текстовых сообщений на устройствах Android?
- 23. Какая кодировка Ruby Strings?
- 24. Какая кодировка это?
- 25. Какая кодировка '& lt;'?
- 26. , какая кодировка должна использоваться
- 27. Какая кодировка - это строка?
- 28. Какая очередь сообщений для сообщений пользователя
- 29. Какая правильная кодировка для файлов PS1
- 30. Какая кодировка для хранения декодируемых паролей?
Это не стандарт UTF-8? (Я полагаю, вы уже пробовали это?) Я также не уверен, что это действительно связано с программированием. –
Когда Microsoft начала использовать UTF-8 для чего-нибудь? Я считаю, что они все еще называют UTF-16 просто «Unicode»? –