У меня есть данные, поступающие из csv, который имеет несколько тысяч столбцов и десять тысяч (или так) строк. Внутри каждого столбца данные одного типа, но разные столбцы имеют данные разного типа *. Раньше я собирал данные из numpy и сохранял их на диске, но это довольно медленно, особенно потому, что обычно я хочу загрузить некоторые подмножества столбцов, а не все из них.Как хранить широкие столы в pytables/hdf5
Я хочу поместить данные в hdf5 с помощью pytables, и первым моим подходом было размещение данных в одной таблице с одним столбцом hdf5 на столбец csv. К сожалению, это не сработало, я предполагаю из-за ограничения 512 (мягких) столбцов.
Что такое разумный способ хранения этих данных?
* Я имею в виду, тип данных после его преобразования из текста.
В настоящее время хранится как обычный словарь массивов numpy. – acrophobia
32 предела столбца в numpy? Нет такого предела. numpy никогда не снимался с таким пределом. –
@PhilCooper OP может означать «размеры», а не столбцы. numpy имеет предел 32 для размерности. https://github.com/numpy/numpy/issues/5744 –