2012-02-22 3 views
0

У меня есть следующий код. Я использую библиотеку jsoup для извлечения URL-адресов с веб-сайта; после этого я проверяю, содержат ли URL-адреса ключевое слово, которое я хочу, и перечислить их в другой строке. Моя проблема в том, что я не могу получить только один URL. Посмотрите на мой код:Несколько строк строк для разделенных новых строк для каждой строки

// Get the webpage and parse it. 
org.jsoup.nodes.Document doc = Jsoup.connect("http://www.examplepage").get(); 

// Get the anchors with href attribute. 
// Or, you can use doc.select("a") to get all the anchors. 
org.jsoup.select.Elements links = doc.select("a[href]"); 

// Iterate over all the links and process them. 
for (org.jsoup.nodes.Element link : links) { 
    String scrapedlinks += link.attr("abs:href")+"\n" ; 
    String scrapedlinks3 ="";     
} 

String[] links2 = links.split("\n"); 
for (String newlink : hulklinks ) { 
     if (newlink("mysearchterm")) { 
      scrapedlinks3 +=newlink ; 
      String[] scrapedlines = scrapedlinks3.split("\n"); 
     } 
} 
+1

Не могли бы вы быть более конкретными в том, что вы пытаетесь выполнить? Не могли бы вы опубликовать URL-адрес, который вы обрабатываете, или какой-нибудь образец HTML? Не могли бы вы отформатировать свой код, чтобы выглядеть немного чище? –

ответ

0

Я думаю, что это будет легче, если вы непосредственно хранить адреса в Arraylist:

Arraylist<String> urls = new Arraylist<String>(); 
for (org.jsoup.nodes.Element link : links) 
    urls.add(link.attr("abs:href")); 

После этого вы можете легко получить доступ к ним с

urls.get(i);