2015-05-13 4 views
-1

У меня есть XML-файл (данные postoverflow postover), который мне нужен, чтобы иметь возможность запускать запросы для проекта данных. Я попытался импортировать XML-файл в Access и Excel, но единственная проблема заключается в том, что файл XML составляет 30 гигабайт. Ничего не произошло, когда я импортировал его в Access, и мой компьютер (школьный компьютер) прекратил работать, когда я попробовал Excel. Есть ли способ открыть и запустить запросы в XML-файле такого размера?MS Excel и Access XML Большой импорт данных

Ссылка на файл XML (он сжимается до ~ 6 гигабайт в виде 7z файла) https://archive.org/download/stackexchange

https://archive.org/download/stackexchange/stackoverflow.com-Posts.7z

ответ

0

Эй проблема с набором данных является очень большой. Таким образом, вы можете легко обрабатывать его, используя синтаксический анализ XML на основе pull. Используя этот тип, вы можете легко пересечь все элементы XML, не съедая всю память. Используйте API StAX для обработки XML.

Обработка событий, основанная на событиях, очень удобна в использовании для этой задачи. Начните здесь. http://www.360doc.com/content/12/1126/19/820209_250389830.shtml
http://www.ibm.com/developerworks/xml/library/x-stax1/index.html

Смежные вопросы