Я пытаюсь получить содержимое этого URL-адреса: http://www.chromeball.com, но кодировка символов не очень хорошая.Ошибка кодирования символов!
У меня есть этот код:
$url = 'http://www.chromeball.com';
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
$data = curl_exec($ch);
curl_close($ch);
$dom = new DOMDocument();
$dom->loadHTML($data);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//text() | //@alt | //@title | /html/head/meta[@name="description"] | /html/head/meta[@name="keywords"]');
foreach($nodes as $node) {
$textNodeContent .= " ".$node->nodeValue;
}
$enc = mb_detect_encoding($textNodeContent,'iso-8859-2,iso-8859-1,utf-8');
print iconv($enc,'utf-8//TRANSLIT',$textNodeContent);
Но это не работает. Кодировка символов неверна. Как я могу преобразовать $ textNodeContent в utf-8? Благодарю.
Просьба сообщить о «кодирование является неправильным ». Кроме того, согласно быстрому тесту, страница хранится в utf8. – Maerlyn
mb_detect_encoding ($ textNodeContent, iso-8859-2, iso-8859-1, utf-8 ') return iso-8859-2. Когда я печатаю $ textNodeContent, не отображается правильно. – turbod
Почему вы 'iconv()' в первую очередь? Кодировка уже должна быть utf-8 с самого начала. –