2012-12-12 3 views
0

У меня есть html-файл, и мне нужно извлечь из него имена отделов, используя jsoup.jsoup извлечение данных из таблицы

Document doc = Jsoup.connect("http://directory.binghamton.edu/directory/directory.deptlist").get(); 
System.out.println(doc); 
Elements departments = doc.select("deptlist"); 

for (Element department : departments) { 
    System.out.println(department.text()); 
} 

Я сделал что-то вроде этого, но он не работает.

вид-источник: HTTP: //directory.binghamton.edu/directory/directory.deptlist

Спасибо.

ответ

1

Здесь мы идем!

Document doc = Jsoup.connect("http://directory.binghamton.edu/directory/directory.deptlist").get(); 

Elements departments = doc.select("table#deptlist a"); // Select all 'a' in a 'table'-tag with id 'deptlist' 
String name; 


for(Element element : departments) // Iterate over all Elements available 
{ 
    name = element.text(); // Save the plaintext (no html) of the element 
    System.out.println(name); // Simple output (as an example) 
} 

В своем коде вы выберите тег 'DeptList' не таблицу.
Если вы хотите выбрать все элементы с помощью id=deptlist (в моем примере вы выбираете только таблицы с этими идентификаторами), вы можете использовать этот селектор: doc.select("#deptlist").

Дополнительную информацию о дополнительных данных: JSoup selector API

Смежные вопросы