2014-03-21 2 views
0

Для ссылки http://www.gptoday.com/full_story/view/481779/ Я не могу определить Xpath для автора - Эндрю БенсонНевозможно найти Xpath для автора в ссылке

Ok я использую Chrome для разработчиков инструмент, чтобы найти элемент, а затем Xpath CHecker в Chrome, чтобы подтвердить его. Мое предположение было // div [@ class = 'entry-info'] // a должно работать ИЛИ // div [@ class = 'entry-info']/div/a должен сработать.

+0

Уточнить результаты поиска по более детальному запросу. Например, что вы пробовали до сих пор? – mathielo

+0

Я просто сделал :) Мне интересно, почему xpath не работает для этой ссылки – user3448242

ответ

1

Причина, по которой вы не можете найти селектор XPath, потому что он не существует на этой странице. Эта страница обертывает статью BBC в iframe (вероятно, нарушая TOS of BBC.com). Вы должны будете следовать URL-адресу статьи BBC.com в iframe. После того как вы извлекли правильный URL (в данном случае http://www.bbc.com/sport/0/formula1/26647993), вы можете использовать следующие XPath:

substring-after(//*[@class='article']//*[@itemprop='name'],'By ') 

который возвращает Andrew Benson, как вы хотите.

+0

Thanks Mark. Как вы получили URL-адрес http://www.bbc.com/sport/0/formula1/26647993? – user3448242

+0

Просмотр источника на сайте gptoday.com, и вы видите