У меня есть XML-файл с тысячами строк нравится:XML для панд dataframe
<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>
Я хочу, чтобы преобразовать его (все это атрибуты) для pandas
dataframe
. Для этого я мог бы прокручивать файл с помощью красивого супа и вставлять значения по строкам или создавать списки, которые нужно вставлять в виде столбцов. Однако я хотел бы знать, есть ли более питонический способ выполнить то, что я описал. Заранее спасибо.
Пример кода:
x1list=[]
x2list=[]
for word in soup.page.findAll('word'):
x1list.append(int(word['x1']))
x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})
Покажите нам код. – eumiro
@eumiro: добавлен пример кода ... – root