Я разбираю .html
файл с помощью Jsoup
.
И у меня есть тег <tr>
.
Этот <tr>
тег имеет следующее содержание:
не удается получить дублированные теги с использованием Jsoup
<tr height="40" align="center">
<td class="small" style="padding-top: 5px;" bgcolor="#f1f1f1"><strong>Data1</strong><span class="small1"><br>time1</span></td>
<td align="center" class="small"> </td>
<td align="center" class="small"> </td>
<td align="center" class="small" bgcolor="#eeeeee" rowspan="2"> </td>
<td align="center" class="small"> </td>
<td align="center" class="small"> </td>
<td align="center" class="small" bgcolor="#eeeeee" rowspan="2"> </td>
<td align="center" class="small"> </td>
<td class="small" style="padding-top: 5px;" bgcolor="#eeeeee" rowspan="2"><strong>Data2</strong><span class="small1"><br>time2</span></td>
</tr>
И мне нужно каждый <td>
теги выше.
Итак, я попробовал код, используя Elements.selector()
так:
String str;
int size;
// ...
Elements elems; // it has <tr> tag above.
// ...
str = elems.select("td").toString();
size = elems.select("td").size();
Так что я думаю, что теперь size
должен быть 9
и str
должен имеет ниже значения:
<td class="small" style="padding-top: 5px;" bgcolor="#f1f1f1"><strong>Data1</strong><span class="small1"><br>time1</span></td>
<td align="center" class="small"> </td>
<td align="center" class="small"> </td>
<td align="center" class="small" bgcolor="#eeeeee" rowspan="2"> </td>
<td align="center" class="small"> </td>
<td align="center" class="small"> </td>
<td align="center" class="small" bgcolor="#eeeeee" rowspan="2"> </td>
<td align="center" class="small"> </td>
<td class="small" style="padding-top: 5px;" bgcolor="#eeeeee" rowspan="2"><strong>Data2</strong><span class="small1"><br>time2</span></td>
Но, когда я скомпилировал этот код,
size
был 4
и str
был, как показано ниже:
<td class="small" style="padding-top: 5px;" bgcolor="#f1f1f1"><strong>Data1</strong><span class="small1"><br>time1</span></td>
<td align="center" class="small"> </td>
<td align="center" class="small" bgcolor="#eeeeee" rowspan="2"> </td>
<td class="small" style="padding-top: 5px;" bgcolor="#eeeeee" rowspan="2"><strong>Data2</strong><span class="small1"><br>time2</span></td>
Я думаю, дублируется <td>
теги удаляются ...
я не понимаю. Мне нужны все теги <td>
.
Я что-то не так?
Это похоже на общую проблему, см. Эту тему [http://stackoverflow.com/questions/32040601/jsoup-elements-removes-duplicates-automatically](http://stackoverflow.com/questions/32040601/ jsoup-elements-remove-duplicates-автоматически) –
@ralfhtp Спасибо за ваш комментарий. Поэтому я должен понизить версию 'Jsoup' до' 1.7' или дождаться новой версии ... Спасибо – Chris
См. Также: http://stackoverflow.com/q/34987678/363573 – Stephan