2012-03-15 4 views
0

Я использую Python для записи данных в .xml-файлы. У меня есть этот файл с именем statistics.xml, и каждый раз, когда я вызываю свой метод writeIntoXml(), он должен добавлять данные в этот XML-файл статистики. Теперь Python делает это отлично, единственная проблема заключается в том, что он добавляет нежелательные пробелы между всеми моими элементами, которые были в файле, прежде чем я ввел в него новые данные. Как это:Python minidom нежелательные пробелы

<AantalTicketsPerUur> 
    <Dag datum="2012-03-16"> 
     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 
     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 
     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 
     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 
    </Dag> 
</AantalTicketsPerUur> 

становится это (элементы без этого пробела между ними являются новые данные):

<AantalTicketsPerUur> 


    <Dag datum="2012-03-16"> 


     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 


     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 


     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 


     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 


    </Dag> 


    <Dag datum="2012-03-16"> 
     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 
     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 
     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 
     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 
    </Dag> 
</AantalTicketsPerUur> 

Как я могу решить эту проблему? Примечание: Я использую метод .toprettyxml()

Заранее спасибо

ответ

1

Вы можете использовать toxml вместо toprettyxml, который не изменяет формат:

def write_xml(filename, dom): 
    f = open(filename, "w") 
    f.write(dom.toxml("utf-8")) 
    f.close() 
0

Я согласен с ответом от qgi. Но обратите внимание, что два метода, похоже, имеют противоположные причуды в отношении комментариев, найденных в корневом элементе OUTSIDE. Например, если я разобрать этот XML-файл с minidom ...

<?xml version="1.0" encoding="utf-8"?> 

<!-- testing 1 --> 
<!-- testing 2 --> 

<sources autodelete="false" syncmedia="true" multivalue_separator=";; "> 

    <!-- testing 3 --> 
    <source 
     id_field="Lex GUID" 
     source_audio_folder="samples/audio" 
     source_image_folder="samples/pictures" > 
     <source_field anki_field="Lex GUID" /> 
    </source> 

    <!-- Test blah blah 
     blah blah 
     blah 
    --> 
    <source 
     id_field="Example" 
     source_audio_folder="samples/audio" 
     source_image_folder="samples/pictures" > 
     <source_field anki_field="Example" /> 

    </source> 

</sources> 

<!-- test THE END --> 

... и тогда я сохранить его как два различных файлов, ToXml сохраняет эти внешние части красиво (но не внутри корня), и toprettyxml сохраняет ТОЛЬКО части внутри корня. Я использую Python 2.7 BTW. Вот tmp1.xml ('довольно'):

<?xml version="1.0" encoding="utf-8"?><!-- testing 1 --><!-- testing 2 --><sources autodelete="false" multivalue_separator=";; " syncmedia="true"> 

    <!-- testing 3 --> 
    <source id_field="Lex GUID" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 
     <source_field anki_field="Lex GUID"/> 
    </source> 

    <!-- Test blah blah 
     blah blah 
     blah 
    --> 
    <source id_field="Example" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 
     <source_field anki_field="Example"/> 

    </source> 

</sources><!-- test THE END --> 

... и вот tmp2.xml (обычная ToString):

<?xml version="1.0" encoding="utf-8"?> 
<!-- testing 1 --> 
<!-- testing 2 --> 
<sources autodelete="false" multivalue_separator=";; " syncmedia="true"> 



    <!-- testing 3 --> 


    <source id_field="Lex GUID" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 


     <source_field anki_field="Lex GUID"/> 


    </source> 



    <!-- Test blah blah 
     blah blah 
     blah 
    --> 


    <source id_field="Example" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 


     <source_field anki_field="Example"/> 



    </source> 



</sources> 
<!-- test THE END --> 

На всякий случай, вот Python код, который производится те:

import xml.dom.minidom as minidom 
tree = minidom.parse(file_path) 
s1 = tree.toxml('utf-8') 
s2 = tree.toprettyxml(' ', '\n', 'utf-8') 
with open ('tmp1.xml', mode='w') as outfile: # Python 3 would also allow: encoding='utf-8' 
    outfile.write(s1.encode('utf-8')) 
with open ('tmp2.xml', mode='w') as outfile: 
    outfile.write(s2.encode('utf-8')) 
+0

И оба метода, как представляется, создают неповторимые строки (иногда как CR, а иногда и CR LF; aka \ r или \ r \ n). Хорошей новостью является то, что вывод из toprettyxml() может быть прочитан, а затем сохранен обратно с * одинаковым * форматированием, что было бы здорово, если бы я мог жить с 3-4 пустых строк, которые он хочет между каждым элементом –