У меня есть URL-адрес, из которого мне нужен его HTML. Я использовал следующий фрагмент кода.Сохранение HTML-страницы в строке
String url = "http://www.sears.com/search="+keywords;
String jsp = retrieveContent(url);
Я заметил, что строка jsp
имеет различное содержание, чем фактический исходный код веб-страницы (при просмотре источника из браузера). Я считаю, что сценарий на стороне сервера (или он перенаправляется) вызывается при открытии браузера, и выход этого скрипта я вижу. Можете ли вы рассказать мне, как получить фактический html-файл страницы?
Вы можете проверить эту ссылку в качестве примера. как я могу получить фактический html этого pagE?
http://www.sears.com/search=baby%20strollers
Это не имеет никакого отношения к JSP. Вероятно, он отправляет разные ответы различным пользовательским агентам. – SLaks
попробуйте использовать http на этом URL-адресе. http://stackoverflow.com/questions/1485708/how-do-i-do-a-http-get-in-java – sircapsalot
Я расскажу немного более четко. Мне нужно получить html-файл с url в java, но когда я это сделаю, он показывает другой исходный код, а не фактический исходный код, вы знаете, как получить фактический исходный код? Я пробовал использовать htmlunit, но не знаю, как правильно его использовать – user2804374