2013-03-01 6 views
0

Мне нужно извлечь ТОЛЬКО эти публикации с веб-страницы http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html, где первым автором является Рахул Рао.Как извлечь конкретный контент с веб-страницы с помощью jsoup

Я пробовал следующий код, но он не дает мне никакого вывода.

for(Element element : doc.select("table span.this-person.title")){ 
System.out.println(element.text()); 
} 

Что необходимо для получения предпочтительного выхода? Заранее спасибо.

+0

Пожалуйста, ребята, помогите мне с this.I я застрял здесь .... – user1320030

ответ

1

Приведенный ниже код даст вам ожидаемый результат. Если это вам поможет!

Документ doc = Jsoup.connect ("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html") .get(); Элементы span = doc.select (("div [class = data]"));

//System.out.println(span.tagName("span")); 
    for (Element src : span) { 

     for(int i=0;i<src.childNodeSize();i++){ 
      if(src.childNodes().get(0).toString().contains("Rahul Rao")){ 
       if(src.childNodes().get(i).toString().contains("<span class=\"title\">")){ 
        System.out.println(src.childNodes().get(i)); 
       } 

      } 
+0

Спасибо Satyendra ... – user1320030

0

Я попытался извлечь публикации, опубликованные на странице, и получил некоторый успех.

Код выглядит следующим образом:

Document doc = Jsoup.connect("http://www.informatik.uni-trier.de/~ley/pers/hd/r/Rao:Rahul.html").get(); 
    Elements span = doc.select("span"); 
    for (Element src : span) { 
     if (src.tagName().equals("span")){ 
      System.out.println(); 
      System.out.print(src.ownText()); 
     } 
    } 

Пожалуйста, смотрите, если это помогает !!

+0

Но это дает мне все публикации Рахули Rao..I нужно только те издания, где Рахул Рао является первым автором. – user1320030

+0

Можете ли вы сказать мне, каков должен быть ваш ожидаемый результат или в каких публикациях Рахул Рао является первым автором. – Satyendra

Смежные вопросы