2015-08-24 5 views
1

Есть такой код HTML, как этот. Как я могу получить заголовок?Как xpath может извлечь эти данные?

<a class="question_link" href="/n/1639322" target="_blank"> 
<div class="question_text_icons"> 
<span></span> 
</div> 
" 
This is the page title, which I want to get. 
" 
</a> 

мой XPath является

//a[@class="question_link"]/text() 

но выход был

"\n" 
"\nThis is the page title, which I want to get.\n" 

Я только хочу "Это заголовок страницы, который я хочу получить.".

ответ

0

Один из вариантов, чтобы найти внутренний DIV и получить следующий текст родственный:

//a[@class="question_link"]/div[@class="question_text_icons"]/following-sibling::text() 

Или получить last текстовый узел:

//a[@class="question_link"]/text()[last()] 
+0

оба сработано.ths –

2

Другой возможный вариант, с помощью normalize-space() в предикате, чтобы отфильтровать пустые текстовые узлы:

//a[@class="question_link"]/text()[normalize-space()] 
+0

спасибо, он работает. –

Смежные вопросы