2012-06-25 6 views
0

Мне нужно получить исходный код конкретного URL-адреса с помощью Java-кода. Я смог получить исходный код для кодированной UTF-8 веб-страницы, но не смог получить код для кодированного набора символов ISO-8859-1. Мой вопрос: можно ли получить исходный код сайта с помощью iso-8859-1 с помощью java-программы? Пожалуйста, помогитеПолучить исходный код URL-адреса

+0

Покажите нам свой код. Вероятно, вы используете стандартную системную кодировку, а кодировка 'ISO' должна быть явно указана где-то. –

+0

Каков был код, который использовался для получения страницы utf-8 и где он не работает для другого? – Mark

ответ

0

Если вы читаете, используя следующий метод вам необходимо указать набор символов явно

URL url = new URL(URL_TO_READ); 
    BufferedReader in = new BufferedReader(
    new InputStreamReader(url.openStream(),"ISO-8859-1")); 

Как всегда, если есть немного синтаксический анализ включает в себя с вашим требованием, я хотел бы предложить вам использовать JSOUP и он будет прочитайте набор символов из ответа сервера, также вы можете explicitly set the charset

+0

хорошо JSOUP работал ... спасибо приятелю – prasad

+0

Добро пожаловать, вы можете отметить его как принято :) –