Я работаю над приложением для Android, которое анализирует сайт, но я не могу заставить Jsoup работать.JSoup Parsing issues
Я пытаюсь разобрать этот HTML:
Мой код только сейчас:
Document doc = null;
try{
doc = Jsoup.connect("URL").get();
Elements tds = doc.select("table.tr>td");
for (Element td : tds) {
String tdText = td.text();
System.out.println(tdText);
}
}
На данный момент она ничего не возвращает, но если я печатаю «документ» его вернуть весь сайт.
Я пытаюсь извлечь следующую информацию: Drower, Е. С. (Этель Stefana), Девушку, б. 1879, с или без & nbsp.
Но я не могу шов, чтобы заставить его работать.
Благодарим за помощь!
Не '.' для классов? Дети - это 'foo> bar> baz'. –
У меня создалось впечатление, что вы можете смешать их. Что это должно быть вместо смешанного примера. Я действительно в недоумении. – Tbuermann
Вы могли бы смешать их, конечно, но ваш селектор все еще не прав. Вы выбираете 'td' дочерние элементы' table' с классом 'tr'. Вместо этого вы, вероятно, хотите, чтобы ячейки 'td' находились в строках' tr' в 'таблице'. Я считаю, что вы можете получить их, просто используя '' td "' в качестве селектора. Тем не менее, было бы трудно извлечь только нужную вам информацию, поскольку содержащаяся в ней 'td' не имеет идентификатора' id' или какой-либо другой уникальной характеристики, которая может изолировать ее от других элементов 'td' на странице - возможно, это всегда третьей ячейки второй строки в этой конкретной таблице? –