2012-08-24 4 views
0

я пытаюсь разбор следующего URL: http://www.cisg.law.pace.edu/cisg/biblio/full-biblio.htmlОшибка Jsoup? Jsoup.parse застревают

URL url = new URL("http://www.cisg.law.pace.edu/cisg/biblio/full-biblio.html"); 
int timeout = 20 * 1000; 
System.out.println("Start parsing..."); 
Jsoup.parse(url, timeout); 
System.out.println("Done"); 

я запустить его и никогда не получить «Done» сообщение. Странно, что этот HTML-код всего 3 МБ, поэтому я не вижу причины, по которой так долго.

ответ

0

Кажется, что ошибка. Я пробовал то, что вы сказали, используя выпуск jsoup 1.6.3, и выполнение застряло на Document doc = DataUtil.parseByteData(byteData, charset, url.toExternalForm(), req.parser());org.jsoup.helper.HttpConnection.

Вы можете проверить, является ли делается соединение, используя следующий код:

import java.io.BufferedReader; 
import java.io.InputStreamReader; 
import java.net.URL; 
import java.net.URLConnection; 

import org.jsoup.Jsoup; 

public class JSoupTest 
{ 
    public static void main(String[] args) throws Exception 
    { 
     URL url = new URL("http://www.cisg.law.pace.edu/cisg/biblio/full-biblio.html"); 
     //int timeout = 20 * 1000; 
     System.out.println("Start parsing..."); 
     //Jsoup.parse(url, timeout); 

     URLConnection con = url.openConnection(); 
     BufferedReader reader = new BufferedReader(new InputStreamReader(con.getInputStream())); 

     String line = null; 
     while(true) 
     { 
      line = reader.readLine(); 
      if(line == null) 
       break; 
      System.out.println(line); 
     } 

     System.out.println("Done"); 
    } 
} 
Смежные вопросы