Я хочу, чтобы получить «игру игрой» информации с веб-сайта:Как обрабатывать несогласованную разметку с помощью селекторов Scrapy?
http://www.euroleague.net/main/results/showgame?gamecode=197&seasoncode=E2015#!playbyplay
Tricky код разметки:
<tr>
<td>8</td>
<td>Def Rebound</td>
<td>13 - 13</td>
<td>Zalgiris Kaunas</td>
<td>VECVAGARS, KASPARS</td>
</tr>
<tr class="play">
<td>8</td>
<td>Two Pointer</td>
<td>15 - 13</td>
<td>Zalgiris Kaunas</td>
<td>VECVAGARS, KASPARS</td>
</tr>
Когда очки сделаны в игре он использует:
<tr class="play">
вместо:
<tr>
... отделить информацию визуально. Я хочу, чтобы получить «событие после события» и мой код, который я использую не могу справиться с этим:
for sel in response.xpath('//div[@class="wp-field wp-field-content table-responsive"]//div/table/tbody/tr'):
item['Minute'] = sel.xpath('td[1]/text()').extract()
Результат, который я ПОЛУЧАТЬ является:
{'Event': [u'Def Rebound'],
'Minute': [u'19'],
'Player': [u'KIRILENKO, ANDREI'],
'Res_h': [u'31 - 38'],
'Res_v': [u'31 - 38'],
'Team_player': [u'CSKA Moscow']}
{'Event': [],
'Minute': [],
'Player': [],
'Res_h': [],
'Res_v': [],
'Team_player': []}
Пустые значения появляется, когда код имеет для работы с классом «play» для «tr».
Вопрос:
Как я могу это сделать, когда у меня есть два возможных варианта разметки, которые accures в определенных случайных ситуациях?