2016-05-04 2 views
0

Я пытаюсь просканировать эту страницу: http://www.bbc.com/earth/columns/record-breakers. Когда я пытаюсь получить все доступные ссылки, моя программа возвращает только часть фактической ссылки.Java Jsoup extracting "alt"

Как вы можете видеть на картинке, значение атрибута href содержит только некоторую часть фактической ссылки. На веб-сайте, когда я перемещаю мышь над статьей, появляется небольшая коробка в левом нижнем углу экрана с правой ссылкой.

У меня не так много знаний в HTML, но я только что узнал, что это называется атрибутом «alt», поэтому мой вопрос заключается в том, как я могу получить эту информацию в левом углу с помощью Jsoup?

enter image description here

ответ

1

Используйте абс: префикс атрибута разрешить абсолютный URL из атрибута. Пример для страницы выше:

public static void main (String []args) throws IOException { 

    Document doc = Jsoup.connect("http://www.bbc.com/earth/columns/record-breakers").get(); 
    Elements link = doc.select("div.promo-unit-header a");  

    for(Element e : link){ 
     System.out.println(e.attr("abs:href"));      
    }  

} 
+0

сейчас он работал, спасибо :) – imoteb