1
Я пытаюсь получить все значения в div. Например:получение всех значений дочерних узлов текущего узла
<div>xyz <span> abc </span> def</div>
Это код
the_page="<div>xyz <span> abc </span> def</div>"
doc = libxml2dom.parseString(the_page, html=1)
divs=doc.getElementsByTagName("div")
print divs[0].firstChild.nodeValue
Это только печатает "XYZ". Я попытался просто распечатать divs [0] .nodeValue, но это дает мне ошибку. Я хочу весь текст. Как мне обойти это?
Пожалуйста, уточните свой вопрос с исходным кодом Python, который возвращает неправильное значение. – pts
Вы попробовали 'textContent'? –
Под «значениями» вы имеете в виду узлы или текст? – habnabit