2012-06-08 4 views
5

У меня есть XML-файл с тысячами строк нравится:XML для панд dataframe

<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word> 

Я хочу, чтобы преобразовать его (все это атрибуты) для pandasdataframe. Для этого я мог бы прокручивать файл с помощью красивого супа и вставлять значения по строкам или создавать списки, которые нужно вставлять в виде столбцов. Однако я хотел бы знать, есть ли более питонический способ выполнить то, что я описал. Заранее спасибо.

Пример кода:

x1list=[] 
x2list=[] 

for word in soup.page.findAll('word'): 
    x1list.append(int(word['x1'])) 
    x2list.append(int(word['x2'])) 
df=DataFrame({'x1':x1list,'x2':x2list}) 
+0

Покажите нам код. – eumiro

+0

@eumiro: добавлен пример кода ... – root

ответ

3

Попробуйте это:

DataFrame.from_records([(int(word['x1']), int(word['x2'])) 
         for word in soup.page.findAll('word')], 
         columns=('x1', 'x2')) 
+0

Спасибо. Я дам ему попробовать. – root

Смежные вопросы