2015-04-28 2 views
0

Я работаю над XML-файлом, который очень велик (я думаю, что, поскольку около 45 ГБ), я должен искать в документе данные OpenStreetMap и находить конкретный путь, который удовлетворяет определенным критериям. В настоящее время я использую XML element tree, но я думаю, что он немного медленный, так как мне нужно искать XML для конкретных географических координат. Есть лучший способ сделать это ? Я также видел немного lxml, однако, я хотел бы знать, есть ли лучший выбор между ними? Спасибо!Каков наилучший способ обработки XML в Python?

+4

Если вам нужно сделать это снова и снова, вам следует подумать об импорте данных в пространственную базу данных. – scai

ответ

0

Пакет sax подходит для синтаксического анализа огромных xml файлов, которые невозможно загрузить в память сразу. Парсер будет «по очереди» и уведомлять вас, когда он столкнулся с началом или концом элемента, вместо того, чтобы загружать файл в память, разбирать его и давать вам все дерево.

Смежные вопросы