У меня есть XML-файл, полный строк utf-8 с французского языка. Некоторые сообщения являются следующими:Кодирование UTF8 неспособно декодировать
«N'oubliez па d'Ã © crire ль ном точным де ле Professeur, без utiliser де Abra © viations»
Как вы можете видеть, акценты не удаются. Я попытался преобразовать файл с iconv, но кажется, что он не распознается как UTF-8 (когда файл использует эту кодировку). Что я могу сделать?
Спасибо!
Вы не сказали, что вы делаете с файлом после его декодирования - например, независимо от того, показываете ли вы его (и как), конвертируете его в другую кодировку и т. д. –
Я уверен, что этот файл использует кодировку ISO-8859-1, поэтому используйте эту кодировку, чтобы ее правильно прочитать. –
Это выглядит точно так же, как кодированный файл UTF-8, считываемый в кодированную ANSI строку. Пожалуйста, прочтите файл с указанием правильного набора символов ... –