Рассмотрим следующий URL: click herePHP локон японский выход искажен
Существует некоторая кодировка в японских символов. Браузер Firefox на моем ПК способен автоматически обнаруживать его и показывать символы. Для Chrome, с другой стороны, я должен вручную изменить кодировку на «Shift_JIS», чтобы увидеть японские символы.
Если я пытаюсь получить доступ к контенту с помощью PHP-локон, закодированный текст в искаженном виде, как этот
φîƂȂI ݂ ȂN`R ~ T C g i A b g R X j ɂ ܂ I
Я пробовал:
curl_setopt($ch, CURLOPT_ENCODING, 'Shift_JIS');
Я также попытался (после скачивания завихрение):
$output_str = mb_convert_encoding($curl_response, 'Shift_JIS', 'auto');
$output_str = mb_convert_encoding($curl_response, 'SJIS', 'auto');
Но это тоже не сработает.
Вот полный код
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($ch, CURLOPT_HTTPHEADER, array(
'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Language: en-US,en;q=0.5',
'Connection: keep-alive'
));
//curl_setopt($ch, CURLOPT_ENCODING, 'SJIS');
curl_setopt($ch, CURLOPT_USERAGENT, $useragent);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_TIMEOUT, 20);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
$response = curl_exec($ch);
Может это быть сжаты? http://stackoverflow.com/questions/310650/decode-gzipped-web-page-retrieved-via-curl-in-php – JimL
может быть. Как справиться с этим в cURL? – hvs
Это объясняется на странице, которую я связал с – JimL