2016-08-09 6 views
2

Я пытаюсь получить все href ссылки через XPath со следующей страницы:XPath - Get HREF атрибута

href page

Я попытался следующие:

//div[@class='article-tile__images']/a[@class='article-tile__link js-article-tile__link acte-article-catalogName-lnk'] 

Любые предложения, что я делаю неправильно?

Я ценю ваши ответы!

+0

'xmllint --html' выдает огромное количество ошибок на странице: XPath в результате будет изворотливым. – bishop

ответ

3

Работа с class атрибутами гораздо проще, читаемым и лаконичным в CSS селекторов:

a.article-tile__link 

, который соответствует 65 ссылок, когда я выполняю $$('a.article-tile__link') в консоли Chrome.

+0

Thx для вашего быстрого ответа! Как бы это выглядело в xpath? – mrquad

+1

@mrquad наилучшим образом, самым простым будет '// a [содержит (@class," article-tile__link ")]'. Но, если вы собираетесь придерживаться xpath здесь, лучше используйте 'concat()', чтобы более надежно обрабатывать несколько классов и избегать сюрпризов, см. Http://stackoverflow.com/a/5662452/771848. Благодарю. – alecxe

Смежные вопросы