2012-05-04 3 views
4

Я пытаюсь извлечь все url изображения с этой страницы с помощью jsoup? Может ли кто-нибудь предложить помощь в том, как это сделать? Все теги форматирования, как это, но мне нужно только Src образ, а не ajaxsrc:Извлечь изображение src с помощью JSoup

<IMG ajaxsrc="/pics32/160/MP/MPYXBXTSYVKAKJQ.20110918032436.jpg" src="http://image.cdnllnwnl.xosnetwork.com/pics32/160/MP/MPYXBXTSYVKAKJQ.20110918032436.jpg"> 

Вот ссылка: http://www.ncataggies.com/PhotoAlbum.dbml?DB_OEM_ID=24500&PALBID=417884

Является ли это формат?

 Document doc = null; 
    try { 
     doc = Jsoup.connect(articleLink).timeout(10000).get(); 
    } catch (IOException ioe) { 
     return null; 
    } 
    Element content = doc.getElementById("div.thumb-image preview"); 
    Elements links = content.getElementsByAttribute("IMG"); 
    for (Element link : links) { 
     String source = link.attr("src"); 
     Elements imageLinks = link.getElementsByAttribute(source); 
     for(Element imageLink: imageLinks){ 
      //imageLink = picture link? 
     } 

} 

Это не похоже на это. У меня есть инструкции печати в моем коде, и они не попадают.

ответ

0

Предположив у вас уже есть элемент в соответствии с этим IMG, попробуйте следующее:

источник Строка = img.attr ("Src");

Этот метод атр наследуется от класса Node

HTH

+0

ну, не совсем. Я просто знаю формат тега img, но его вложен в тег div. Поэтому я не знаю, как его извлечь. –

+0

Ну, в этом случае поместите div в объект Element, затем вызовите getElementsByAttribute ("src"), который должен вернуть массив этих элементов IMG. – PedroSena

+0

Можете ли вы привести мне пример, я пытаюсь представить, что вы говорите –

12

Вы должны быть в состоянии сделать что-то вроде этого, чтобы получить все IMG теги:

for (Element e : doc.select("img")) { 
    System.out.println(e.attr("src")); 
} 

Это должно выбрать все IMG теги и затем возьмите атрибут src и распечатайте его на консоли.

0
Document document = Jsoup.connect(" http://www.ncataggies.com/PhotoAlbum.dbml?DB_OEM_ID=24500&PALBID=417884").get(); 

     Elements elements =document.getElementsByTag("IMG"); 
     for(int i=0;i<elements.size();i++) 
     { 
      System.out.println("Sources of "+ i +":"+elements.get(i).attr("src")); 
     } 
Смежные вопросы