0
Я пытаюсь получить данные из таблицы HTML, но когда я подключаюсь к веб-сайту, он не возвращает то, что он показывает в браузере.Неожиданный результат со страницы
Это то, что я ожидал получить, посмотрев на результат HTML:
<div id="ResultsContainer">
<div id="Pagination"><div class="left">displaying: 601 - 633 of 633</div><div class="right">
...
и вот что я получаю:
<div id=ResultsContainer>
<p class=RedBold10pt>Search returned no matches</p>
</div>
Вот мой Java код
HttpClient client = new DefaultHttpClient();
HttpGet request = new HttpGet();
request.setHeader("User-Agent", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_3) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.15 Safari/536.5");
request.setURI(new URI("http://results.active.com/pages/searchform.jsp?posted_p=t&numPerPage=50&page=0&rsID=10505&queryType=division#VIEW"));
HttpResponse response = client.execute(request);
BufferedReader in = null;
in = new BufferedReader(new InputStreamReader(response.getEntity().getContent()));
StringBuffer sb = new StringBuffer("");
String line = "";
String NL = System.getProperty("line.separator");
while ((line = in.readLine()) != null) {
sb.append(line + NL);
}
in.close();
String page = sb.toString();
System.out.println(page);
Что может быть причиной этого?
Запрос, отправленный из браузера, очевидно, был не таким, как запрос, отправленный вашим приложением java. Используйте приложение, подобное скрипачу, чтобы узнать, совпадают ли оба запроса. –
Это может быть хэш-тег по URL-адресу: см. Http://stackoverflow.com/questions/4251841/400-error-with-httpclient-for-a-link-with-an-anchor –