2016-04-22 5 views
0

Я новичок в Python. Recenty, у меня есть проект, который обрабатывает огромное количество данных о здоровье в XML-файле. Вот пример:магазин большие данные python

enter image description here

В моих данных, существует около 100 из них, и каждый из них имеет другой идентификатор, происхождение, тип и текст. Я хочу хранить в данных все из них, чтобы я мог обучать этот набор данных, первая идея в моем сознании заключалась в использовании 2D arry (один хранит идентификатор и источник в другом сохраненном тексте). Тем не менее, я обнаружил, что слишком много функций, и я хочу знать, какие функции принадлежат каждому документу.

Может ли кто-нибудь рекомендовать лучший способ сделать это.

+1

Возможно, вы можете уйти со словарем с ключом id и ключом (с функциями как ключи и их значениями как значения) или объектом в качестве значения. – DeepSpace

+0

Я скопировал изображение в ваш вопрос, но лучше разместить соответствующий код, используя '{}' вместо изображения. – Leb

+0

Что касается вашей проблемы, я бы предложил использовать XML-парсинг-пакеты для получения данных, в которых вы можете импортировать в словарь или возможный фрейм данных. То, как это происходит сейчас, ваш вопрос слишком широк. – Leb

ответ

0

Для масштабируемости, простоты и охранения, вы должны нормировать эти данные, построить схему базы данных и переместить эти вещи в базу данных (SQLite, Postgres, MySQL, что угодно)

Это переместит логик усложнять данные из питона. Это типичная практика Model-view-controller.

Создайте словарь python и пройдите по нему быстрым и грязным. Вскоре это станет огромным техническим временем, если вы хотите сделать практический смысл из данных.

Смежные вопросы