2012-07-09 3 views
0

Я только что слышал об этом HtmlUnit, когда я пытался выяснить, как сбрасывать исходный код веб-сайта. То, что я пытаюсь сделать, это использовать скрипт, чтобы сбрасывать исходный код с веб-сайта, но когда я запускаю его, получаю красивый длинный список красного цвета.Ошибка HtmlUnit при попытке подключения веб-страницы

Это код им с помощью:

public static void main(String[] args) throws FailingHttpStatusCodeException, MalformedURLException, IOException { 

    String url = "http://www.runelocus.com/forums/member.php?102785&tab=aboutme#aboutme"; 
    WebClient client = new WebClient(BrowserVersion.FIREFOX_3_6); 
    HtmlPage page = client.getPage(url); 
    System.out.println(page.getWebResponse().getContentAsString()); 
} 

Это ошибки им получить:

Exception in thread "main" org.apache.http.client.ClientProtocolException 
at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:822) 
at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:776) 
at com.gargoylesoftware.htmlunit.HttpWebConnection.getResponse(HttpWebConnection.java:152) 
at com.gargoylesoftware.htmlunit.WebClient.loadWebResponseFromWebConnection(WebClient.java:1439) 
at com.gargoylesoftware.htmlunit.WebClient.loadWebResponse(WebClient.java:1358) 
at com.gargoylesoftware.htmlunit.WebClient.getPage(WebClient.java:307) 
at com.gargoylesoftware.htmlunit.WebClient.getPage(WebClient.java:373) 
at com.gargoylesoftware.htmlunit.WebClient.getPage(WebClient.java:358) 
at HTMLDumping.htmlunittest.main(htmlunittest.java:18) 
Caused by: org.apache.http.ProtocolException: Invalid header: blcc_proxy 
at org.apache.http.impl.io.AbstractMessageParser.parseHeaders(AbstractMessageParser.java:224) 
at org.apache.http.impl.io.AbstractMessageParser.parse(AbstractMessageParser.java:259) 
at org.apache.http.impl.AbstractHttpClientConnection.receiveResponseHeader(AbstractHttpClientConnection.java:281) 
at org.apache.http.impl.conn.DefaultClientConnection.receiveResponseHeader(DefaultClientConnection.java:247) 
at org.apache.http.impl.conn.AbstractClientConnAdapter.receiveResponseHeader(AbstractClientConnAdapter.java:219) 
at org.apache.http.protocol.HttpRequestExecutor.doReceiveResponse(HttpRequestExecutor.java:298) 
at org.apache.http.protocol.HttpRequestExecutor.execute(HttpRequestExecutor.java:125) 
at org.apache.http.impl.client.DefaultRequestDirector.tryExecute(DefaultRequestDirector.java:645) 
at org.apache.http.impl.client.DefaultRequestDirector.execute(DefaultRequestDirector.java:464) 
at org.apache.http.impl.client.AbstractHttpClient.execute(AbstractHttpClient.java:820) 

Если кто-то может знать, как это исправить пожалуйста, предложите что-нибудь. Все отзывы приняты.

+0

Вы собираетесь использовать «HTMLUnit» для тестирования или пытаетесь «очистить» сайт? Если вы просто хотите «очистить» сайт, тогда [JSOUP] (http://jsoup.org/) - лучший вариант. – radimpe

ответ

0

Использование: System.out.println (page.asText());

Смежные вопросы