2015-02-23 2 views
0

Я попытался очистить сайт с помощью функции urlread2. После определения заголовков и все, что я получил результат, что я не знаю, как читать:Matlab scraping and encoding

'lA® · E ÷ Ос £ $ êoÅð $ qàxdï¿ »ÅKÞDDõa²n_K ~~ ÿùËo¿ûí × ¿? ÿ {е} |? züùý¯o ¿} ÿãYúòåÑïÏËl> ë · Ϫ¯¾ < ÆõùºPZ (5 \ μJc¼KýóWéå ¥ W9¾ká`5tÁjè8ÕÐq «¡ã wbyG .......

Я пробовал некоторые декодирования с unicode2native и ISO-8859-1. Но у меня есть цифры от 0 до 255, и я не знаю, что делать дальше ...

Looki . Нг вперед ваши предложения Спасибо

+0

Вы посмотрели фактический источник сайта? Что он говорит? Что такое URL-адрес и какой код вы используете? – horchler

ответ

0

я нашел причину странного выхода:

Один из заголовков

Accept-Encoding: GZIP, выкачать, SDCH

Следовательно, по умолчанию используется gzip. Как только я вынул этот заголовок, результат вернулся обычным и читаемым способом.