2015-05-09 2 views
2

Это HTML в табличном формате:XPath для содержимого ячеек таблицы HTML, начиная с указанным содержанием

<tr><td style="width: 150px;">Development Name:</td><td><b>Bellewoods</b></td></tr> 
<tr><td style="width: 150px;">Property Type:</td><td><b>Executive Condominium</b></td></tr> 
<tr><td style="width: 150px;">Developer:</td><td><b>Qingjian Realty (Woodlands) Pte Ltd</b></td></tr> 
<tr><td style="width: 150px;">Tenure:</td><td><b>99-year Leasehold</b></td></tr> 
<tr><td style="width: 150px;"># of Floors:</td><td><b>30</b></td></tr> 
<tr><td style="width: 150px;"># of Units:</td><td><b>561</b></td></tr> 

Я хочу, чтобы извлечь эти столбцы в CSV двоичном:

Development Name, 
Property Type, 
Developer, 
Tenure, 
Floors, 
Units 

Я использую этот XPath , но он не работает:

'//tr//td[@style="width: 150px;" and text()="Development Name:"]//td//b' 
+0

Использование поджигатель для inspect.Provide ссылки здесь в комментариях – Ajay

+0

, например, от этого - Название проекта:Bellewoods Как я бы извлек Bellewoods, пожалуйста, обратите внимание на его важное для меня, что он должен от названия разработки? –

+0

для этого голый предмет. html/body/table/tbody/tr [1]/td [2]/b – Ajay

ответ

Смежные вопросы