У меня есть большой XML-файл (около 84MB), который находится в такой форме:Неприятности при разборе с питона очень большой XML-файл
<books>
<book>...</book>
....
<book>...</book>
</books>
Моя цель состоит, чтобы извлечь каждую книгу и получить его свойства. Я пытался разобрать его (как я делал с другими файлами XML) следующим образом:
from xml.dom.minidom import parse, parseString
fd = "myfile.xml"
parser = parse(fd)
## other python code here
но код кажется сбой в инструкции синтаксического анализа. Почему это происходит и как я могу это решить?
Следует отметить, что файл может содержать греческие, испанские и арабские символы.
Это выход я получил в IPython:
In [2]: fd = "myfile.xml"
In [3]: parser = parse(fd)
Killed
Я хотел бы указать на то, что компьютер зависает во время выполнения, так что это может быть связано с потреблением памяти, как указано ниже.
Определить «сбой» ... – Thomas
Не могли бы вы предоставить трассировку стека здесь? –
Выполнение python myparser.py оболочка убита. Я забыл сказать, что у меня нет символов ascii ... может это проблема? – user601836