2010-11-16 11 views
0

У меня есть XML-файл, полный строк utf-8 с французского языка. Некоторые сообщения являются следующими:Кодирование UTF8 неспособно декодировать

«N'oubliez па d'Ã © crire ль ном точным де ле Professeur, без utiliser де Abra © viations»

Как вы можете видеть, акценты не удаются. Я попытался преобразовать файл с iconv, но кажется, что он не распознается как UTF-8 (когда файл использует эту кодировку). Что я могу сделать?

Спасибо!

+0

Вы не сказали, что вы делаете с файлом после его декодирования - например, независимо от того, показываете ли вы его (и как), конвертируете его в другую кодировку и т. д. –

+1

Я уверен, что этот файл использует кодировку ISO-8859-1, поэтому используйте эту кодировку, чтобы ее правильно прочитать. –

+0

Это выглядит точно так же, как кодированный файл UTF-8, считываемый в кодированную ANSI строку. Пожалуйста, прочтите файл с указанием правильного набора символов ... –

ответ

0

Попробуйте открыть файл в Блокноте Windows и посмотреть, как он выглядит. Если это выглядит хорошо, проблема может быть в другом месте (например, вы отправляете данные в браузер и не указываете UTF-8?).

Если это выглядит неправильно в блокноте тоже попробуйте следующее (я скопировал ваши данные в файл и был в состоянии «исправить» его, делая это):

  • Открыть в Блокноте
  • Файл - > Save As -> Выберите "ANSI" и сохранить
  • Откройте новый файл в блокноте
  • файл -> Сохранить как -> Выбрать UTF-8 и сохранить

Это окончательное е ile должен правильно открываться в Блокноте и быть закодирован как UTF-8 с трехбайтовой подписью UTF-8.

Смежные вопросы