Мне нужно получить исходный код конкретного URL-адреса с помощью Java-кода. Я смог получить исходный код для кодированной UTF-8 веб-страницы, но не смог получить код для кодированного набора символов ISO-8859-1. Мой вопрос: можно ли получить исходный код сайта с помощью iso-8859-1 с помощью java-программы? Пожалуйста, помогитеПолучить исходный код URL-адреса
ответ
Если вы читаете, используя следующий метод вам необходимо указать набор символов явно
URL url = new URL(URL_TO_READ);
BufferedReader in = new BufferedReader(
new InputStreamReader(url.openStream(),"ISO-8859-1"));
Как всегда, если есть немного синтаксический анализ включает в себя с вашим требованием, я хотел бы предложить вам использовать JSOUP и он будет прочитайте набор символов из ответа сервера, также вы можете explicitly set the charset
хорошо JSOUP работал ... спасибо приятелю – prasad
Добро пожаловать, вы можете отметить его как принято :) –
Покажите нам свой код. Вероятно, вы используете стандартную системную кодировку, а кодировка 'ISO' должна быть явно указана где-то. –
Каков был код, который использовался для получения страницы utf-8 и где он не работает для другого? – Mark