У меня есть следующий код:Получить utf8 DOM из utf8 файла
<?php
header('Content-Type: text/html; charset=utf-8');
function getSource($url)
{
if (!function_exists('curl_init'))
{
die('CURL is not installed!');
}
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_ENCODING, "UTF-8");
$output = curl_exec($ch);
curl_close($ch);
return $output;
}
$source = getSource('http://www.website.com/');
var_dump($source); die();
И сам файл находится в UTF-8. Дело в том, что символы UTF-8 вывода отображаются неправильно. Вместо этого они отображаются как вопросительные знаки или какой-то другой мусор.
И единственное, что я решил решить, это кодировать файл как ISO-8859-1. Но я не хочу этого. Что здесь не так?
Возможно, стоит упомянуть о некоторых способах преобразования - 'mb_convert_encoding' и' iconv' приходят на ум. – IMSoP