Я пытаюсь извлечь строки с их соответствующими клетками из следующей таблицы:Извлечение строк из таблицы
<table border="0" cellspacing="1" cellpading="3" width="100%">
<tr bgcolor="#505050">
<td><b></b></td>
<td colspan="2" align="center" class="white"><b>Last Day</b></td>
<td colspan="2" align="center" class="white"><b>Last Week</b></td>
</tr>
<tr bgcolor="#505050">
<td class="white"><b>Race</b></td>
<td align="center" class="white"><b>Killed Players</b></td>
<td align="center" class="white"><b>Killed by Players</b></td>
<td align="center" class="white"><b>Killed Players</b></td>
<td align="center" class="white"><b>Killed by Players</b></td>
</tr>
<tr bgcolor="#F1E0C6">
<td>A</td>
<td align="right">0</td>
<td align="right">3</td>
<td align="right">0</td>
<td align="right">13</td>
</tr>
<tr bgcolor="#D4C0A1">
<td>B</td>
<td align="right">0</td>
<td align="right">0</td>
<td align="right">0</td>
<td align="right">7</td>
</tr>
<tr bgcolor="#F1E0C6">
<td>C</td>
<td align="right">0</td>
<td align="right">0</td>
<td align="right">0</td>
<td align="right">1</td>
</tr>
<tr bgcolor="#D4C0A1">
<td>D</td>
<td align="right">0</td>
<td align="right">0</td>
<td align="right">0</td>
<td align="right">7</td>
</tr>
<tr bgcolor="#505050">
<td class=white><b>Total</b></td>
<td align="right" class="white"><b>210</b></td>
<td align="right" class="white"><b>1060458</b></td>
<td align="right" class="white"><b>1132</b></td>
<td align="right" class="white"><b>5585115</b></td>
</tr>
Ряды Я заинтересован в те с A, B, C и т. Д. Рядом с ними номера.
Решение, которое я придумал это:
table = tree.xpath("//table/tr[td[not(contains(@class, 'white'))]]")
for tr in table:
print(tr.xpath('td/text()'))
Однако выход по-прежнему включает в себя первую строку с пустой клеткой и последний день/неделя из них, и выглядит следующим образом:
['', 'Last Day', 'Last Week']
['A', '0', '3', '0', '13']
['B', '0', '0', '2', '0']
['C', '0', '3', '0', '5']
Что можно сделать, чтобы избавиться от него?
Вы можете оставить свой ожидаемый результат? – drkthng
Конечно, обновил исходное сообщение. – adrift