2013-03-26 3 views
1

Я успешно retreving odt xml-файл в python, но я понятия не имею, как вытащить данные XML-файла?Как извлечь данные из файла odt xml в python?

Любые приемы для вытягивания данных файла odt xml.

Вот мой код для извлечения ODT XML файл

#!/usr/lib/python2.7 

import sys, zipfile 

if len(sys.argv) < 2: 
    print "input.odt & output.xml" 
    sys.exit(0) 

content="" 
myfile = zipfile.ZipFile(sys.argv[1]) 
listoffiles = myfile.infolist() 
for s in listoffiles: 
    if s.orig_filename == 'content.xml': 
     fd = open(sys.argv[2],'w') 
     content = myfile.read(s.orig_filename) 
     fd.write(content) 
     fd.close() 

ответ

2

Any techniques are there for pulling the odt xml file data. Я предполагаю, что вы хотите знать, разбор содержимого этого XML-файла. Если это так, я рекомендую BeautifulSoup. BS предназначена для HTML разбора, но может быть изменен, чтобы принять XML-данные:

BS4:

from bs4 import BeautifulSoup 

soup = Beautifulsoup(<xml file contents>, 'xml') 

BeautifulSoup 3:

from BeautifulSoup import BeautifulStoneSoup 

soup = BeautifulStoneSoup(<xml file contents>) 

Здесь вы можете анализировать данные в соответствии с Документами (см. выше).

Смежные вопросы