Я пытаюсь захватить HTML из приведенной ниже страницы, используя некоторые простые php.Почему file_get_contents возвращает искаженные данные?
URL: https://kat.cr/usearch/architecture%20category%3Abooks/
Мой код:
$html = file_get_contents('https://kat.cr/usearch/architecture%20category%3Abooks/');
echo $html;
где file_get_contents
работает, но возвращает вскарабкался данные:
Я попытался с помощью cUrl
, а также различные функции : htmlentities(),
mb_convert_encoding
, utf8_encode
и т. Д., Но просто получайте разные варианты скремблированного текста.
Источник страницы говорит, что это charset=utf-8
, но я не уверен, в чем проблема.
Вызов file_get_contents()
на основании URL-адреса kat.cr
возвращает тот же беспорядок.
Что мне здесь не хватает?
HTTP: // StackOverflow .com/questions/11363022/get-url-content-php Проверьте это. –
Смотрите: [Как я могу прочитать ответ GZIP-ed] (http://stackoverflow.com/q/8581924/55075) – kenorb
scrapeing torrent site, thats kind low –