Я пытаюсь разобрать XML-файл (http://jstryczek.blox.pl/rss2), который говорит, что его набор символов - ISO-8859-2. Моя база данных находится в UTF-8, поэтому я хочу преобразовать ее в UTF-8.Преобразование ISO-8859-2 в UTF-8 (польские символы)
Для этого я бегу следующий на струне:
$content = iconv('ISO-8859-2', 'UTF-8//TRANSLIT', $content);
По какой-то причине, я получаю обратно нечетное кодировку, так что:
Gdzie są różnice
проступает как:
Gdzie sÄ róşnice
Есть ли объяснение, почему польские символы не проходят? Не поддерживает ли UTF-8 их?
UTF-8 поддерживает всех польских персонажей, я уверен. – solusipse
Какая база данных вы используете, как определяются столбцы, как вы храните текст в базе данных и как вы ее извлекаете? UTF-8 отлично поддерживает эти символы. Фактически, сайт stackoverflow полностью находится в UTF-8, и, как вы видите, у вас не возникло проблем с их отправкой. – Joni
Я использую MariaDB со столами в UTF8, клиентское соединение также UTF8. Я думаю, что какое-то неявное преобразование происходит где-то, просто не знаю, где. – hukir