2013-05-18 2 views
1

Возможно ли создать таблицу PyTables без открытия или создания файла hdf5? Что я имею в виду, и что мне нужно, это создать таблицу (ну и на самом деле очень много таблиц) в разных процессах, работать с этими таблицами и хранить таблицы в файле hdf5 только в конце после некоторых вычислений (и обеспечения только одного процесс за один раз выполняет хранение).PyTables, Создание таблицы без открытия файла hdf5

В принципе, я мог бы выполнить все вычисления на обычных данных Python (строки массивов и т. Д.) И выполнить хранение в конце. Тем не менее, почему я был бы признателен за работу с PyTables с самого начала, это проверка работоспособности. Я хочу всегда гарантировать, что данные, с которыми я работаю, вписываются в предопределенные таблицы и не нарушают ограничений формы и т. Д. (И поскольку PyTables проверяет эти проблемы, мне не нужно реализовывать все это самостоятельно).

спасибо и добрые пожелания, Роберт

ответ

1

Вы ищете pandas который имеет great Pytables integration. Вы будете работать со столами полностью, и в итоге вы сможете сэкономить на hdf5 самым простым способом.

0

Вы можете создать массив numpy с заданной формой и типом данных.

my_array = num.empty(shape=my_shape, dtype=num.float) 

Если вам нужно индексировать по имени взглянуть на Numpy рекордсменов массивов (урожденная numpy recarray)

Но если вы работаете непосредственно с PyTable-объект может быть быстрее (см бенчмарк here).

Смежные вопросы