2013-05-05 4 views
0

У меня есть это link, где мне нужно сделать некоторые скребки, используя xPath и domDocument на этой таблице. Мне нужно получить название химического, ссылки и части. Я пробовал использовать хеппер xPath в хроме, но не повезло, он не делает правильный запрос. Любые идеи, что я делаю неправильно? Я использую этот запрос: // table/tbody/tr/td/axPath, DomDocument, Скребок таблицы

ответ

1

Я могу получить данные, которые вы ищете, с помощью хелпера xPath в Chrome следующим образом (эти строки являются набранная в консоли Chrome):

Все химические вещества/первый химический:

> allChemicals = $x("descendant::tr/td[(position() =1)]") 
> firstChemical = allChemicals[0].innerText 

Все ссылки/первая ссылка:

> allLinks = $x("descendant::tr/td[(position() =1)]/a") 
> firstLink = allLinks[0].href 

Все детали/первая деталь:

> allParts = $x("descendant::tr/td[(position() =2)]") 
> firstPart = allParts[0].innerText 

Надеюсь, что это поможет.

+0

Да, ваш xPath отлично работает, есть консоль для xPath, где вы можете создавать запросы. Интересно: -d, даже если они работают, кажется, что когда я использую одно и то же в php, не выбираю то же самое странное , – Bogdan

Смежные вопросы