2013-09-22 3 views
0

У меня есть URL-адрес, из которого мне нужен его HTML. Я использовал следующий фрагмент кода.Сохранение HTML-страницы в строке

String url = "http://www.sears.com/search="+keywords; 
String jsp = retrieveContent(url); 

Я заметил, что строка jsp имеет различное содержание, чем фактический исходный код веб-страницы (при просмотре источника из браузера). Я считаю, что сценарий на стороне сервера (или он перенаправляется) вызывается при открытии браузера, и выход этого скрипта я вижу. Можете ли вы рассказать мне, как получить фактический html-файл страницы?

Вы можете проверить эту ссылку в качестве примера. как я могу получить фактический html этого pagE?

http://www.sears.com/search=baby%20strollers

+0

Это не имеет никакого отношения к JSP. Вероятно, он отправляет разные ответы различным пользовательским агентам. – SLaks

+0

попробуйте использовать http на этом URL-адресе. http://stackoverflow.com/questions/1485708/how-do-i-do-a-http-get-in-java – sircapsalot

+0

Я расскажу немного более четко. Мне нужно получить html-файл с url в java, но когда я это сделаю, он показывает другой исходный код, а не фактический исходный код, вы знаете, как получить фактический исходный код? Я пробовал использовать htmlunit, но не знаю, как правильно его использовать – user2804374

ответ

0

HTML-страница хранится в переменной JSP. alert (jsp) покажет вам страницу.

+0

'Неопределенный локальный метод или переменная 'alert'';) – sircapsalot

+1

Так что это не javascript. alert показывает вам во всплывающем окне, что находится в переменной. –

+0

Поясню немного подробнее. Мне нужно получить html-файл с url в java, но когда я это сделаю, он показывает другой исходный код, а не фактический исходный код, вы знаете, как получить фактический исходный код? Я попытался использовать htmlunit, но не знаю, как правильно его использовать. – user2804374

0

я хотел бы видеть код метода retrieveContent, если это возможно и если вы пытаетесь прочитать содержимое HTML URL-адрес напрямую, то есть хороший пример здесь http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html

+0

Я сделал почти так же, как указано в примере, но html, который я получаю, не совпадает с исходным кодом, который я получаю в браузере. – user2804374

0

Есть много HTML содержания слома библиотеки из там, который будет делать трюк, тот, который я использовал это JSOUP, JSOUP говорит:

«скрести и разбора HTML из URL, файла или строки»

JSOUP может удовлетворить вашу цель.

+0

Jsoup - это то, что я использую, но мне нужно, чтобы HTML обрабатывал его. Прямо сейчас, я не получаю правильный исходный код вообще, я получаю другой исходный код, когда я использую прямой метод для получения URL-адреса html. – user2804374

Смежные вопросы