2015-03-01 5 views
0

У меня ограничено знание html и xml, и я пытаюсь очистить некоторые URL-адреса, чтобы получить блок текста, используя = ImportXML() в Google Spreadsheets.Xpath query for = ImportXML в Google Spreadsheet

Вот ссылка: http://www.worldbank.org/projects/P082167/agricultural-transition?lang=en&tab=overview

<div id="abstractmore" style=""> 

     <h2>ABSTRACT*</h2> 
     <p> 

      The project aims to...be responsible for the general management of the project.<a href="javascript:;" id="rdless" class="more">&nbsp;Read Less»</a> 

     </p> 

    </div> 

Я пытаюсь извлечь полную аннотацию. Я использовал инструмент инспектировать элемент Chrome и просмотрен через различные учебники ... Я был в состоянии придумать с этим XPaths от того, что я прочитал:

//div[@id='abstractmore']/p/text() 
//*[@id="abstractmore"]/p/text() 

Они возвращаются с ошибкой: Импортное содержание пусто. Я полностью потерял, как понять xpath !?

ответ

0

Там нет такого @ ид = 'abstractmore', но:

id="abstract" 
and 
<span class="more"><a href="javascript:;" id="rdmore" class="more">&nbsp;Read More»</a></span> 

, тем не менее, что не помогает, не ясно, почему функция электронной таблицы Google не извлекая H2:

//*[@id="dataSections"]/*[@id="leftSection"]/*[@id="box2"]/*[@id="box2Inner"]/*[@id="tabContent"]/h2 

вероятно, по той же причине не извлекает <p> содержание

Смежные вопросы