2014-02-05 3 views
0

Прямо сейчас я звоню со всех ссылок со страницы на reddit и распечатываю его, но что я могу добавить в мой цикл, чтобы сохранить только ссылки, начинающиеся с http://www.reddit.com/r/askcience/?jsoup специально разобрал href

Document doc; 
    try { 


     doc = Jsoup.connect("http://www.reddit.com/r/askscience/search?q=flair%3A%27Psych%27&sort=top&restrict_sr=on").get(); 


     Elements links = doc.select("a[href]"); 
     for (Element link : links) { 

      System.out.println("\nlink : " + link.attr("href")); 

     } 

    } catch (IOException e) { 
     e.printStackTrace(); 
    } 
} 
+0

читают документ для String.startsWith? – njzk2

+0

или, прочитайте документ для селектора css. – njzk2

ответ

0

Да, вы должны read the docs.

[attr^=valPrefix] elements with an attribute named "attr", and value starting with "valPrefix"

В противном случае, вы можете впитать все ссылки и использовать регулярное выражение или startsWith() на струнах

+0

Так что я могу сделать [href^= http: //reddit.com/r/askscience]? – user3224105

+0

Я думаю, что вы должны включить часть 'http: //', если это в исходном коде (абсолютная ссылка или относительная ссылка). – snowking16

Смежные вопросы