2010-08-15 8 views
1

Я пытаюсь получить все значения в div. Например:получение всех значений дочерних узлов текущего узла

<div>xyz <span> abc </span> def</div> 

Это код

the_page="<div>xyz <span> abc </span> def</div>" 
doc = libxml2dom.parseString(the_page, html=1) 
divs=doc.getElementsByTagName("div") 
print divs[0].firstChild.nodeValue 

Это только печатает "XYZ". Я попытался просто распечатать divs [0] .nodeValue, но это дает мне ошибку. Я хочу весь текст. Как мне обойти это?

+0

Пожалуйста, уточните свой вопрос с исходным кодом Python, который возвращает неправильное значение. – pts

+0

Вы попробовали 'textContent'? –

+0

Под «значениями» вы имеете в виду узлы или текст? – habnabit

ответ

1

для вашего:

divs=doc.getElementsByTagName("div") 

использование:

childs = divs[0].childNodes 

тогда, вы можете сканировать их. Каждый ребенок содержит список дочерних элементов и nodeValue

Смежные вопросы