Этот XML-документ содержит набор тегов events-data
. Я хочу извлечь информацию из самого ПОСЛЕДНИЕ events-data
. Например, в приведенном ниже коде я хочу перейти к тегу events-data
, спуститься до тега event-date
и извлечь текст дочернего тега date
. На данный момент я использую BeautifulSoup в Python для перемещения по этому документу. Есть идеи?BeautifulSoup XML Python, извлекающий атрибуты из определенных тегов
<?xml version="1.0" encoding="UTF-8"?>
<first-tag>
<second-tag>
<events-data>
<event-date>
<date>20040913</date>
</event-date>
</events-data>
<events-data> #the one i want to traverse to grab date text
<event-date>
<date>20040913</date>
</event-date>
</events-data>
</second-tag>
</first-tag>
Я думал, как в 'elementtree' или' minidom', где вы можете пройти теги на основе индекса и длины, но я не могу думать о синтаксисе (или найти что-то в этом отношении), которое будет работать для BeautifulSoup. Имейте в виду, что я все еще новичок в beautifulsoup. – sdweldon
Как-то он должен подсчитывать количество событий 'events-data', возможно,' numEvents = len (soup.find ('events-data')) ', а затем читать дочерние теги по этому индексу? – sdweldon