2015-08-04 2 views
1

Я пытаюсь использовать Jsoup для получения статьи об авторе ACM-DL. Но это не в состоянии получить Jsoup не удается получить <p></p>

Это сайт: http://dl.acm.org/citation.cfm?id=1999265&coll=DL&dl=GUIDE&CFID=698338637&CFTOKEN=48876455

Это мой код раздела

Elements PapaerElm = PaprtDoc.select("div div div p"); 
    for(Element tempAbstract :PapaerElm){ 
      System.out.println(tempAbstract); 
    } 

Как правильно получить реферат?

Спасибо.

+0

Проблема решена? Если да, пожалуйста, примите ответ. – luksch

ответ

0

Поскольку идентификатор DIV является «абстрактным», вы можете сделать это:

Element content = document.getElementById("abstract"); 

А затем разобрать элемент, чтобы получить пункты внутри DIV:

Elements paragraphs = content.getElementsByTag("p"); 

А затем итерацию найти искомый реферат.

+0

Я пробую так. Но ... все еще не удается ... Невозможно получить реферат. –

+0

@ M.X Huang Вы уже пробовали? Или вы будете использовать его? – andrewdleach

+0

Я пробовал, но это не работа ... –

0

Реферат загружается через вызов AJAX. Я использовал сетевые инструменты Chrome, чтобы извлечь этот прямой URL-адрес:

http://dl.acm.org/tab_abstract.cfm?id=1999265 

Таким образом, кажется, что идентификатор исходит из вашего исходного URL. (Я удалил другой материал, включая токен, так как, похоже, не нужно просто получить реферат)

+0

Oh! Понял. Спасибо! –

+0

Если это поможет, вы можете принять мой ответ, а также голосовать (если можете) – luksch