Данный список представляет собой 1,5-гигабайтный список данных для панд., который быстрее для загрузки: pickle или hdf5 в python
Мне интересно, что лучше всего подходит для загрузки этих данных: pickle (via cPickle), hdf5 или что-то еще в python?
Во-первых, «демпинг» данных в порядке, чтобы занять много времени, я делаю это только один раз.
Я также не, касающийся размера файла на диске.
Вопрос: Что меня беспокоит это скорость загрузки данные в памяти как можно быстрее.
Вы пробовали измерить это в ваших конкретных условиях? – pvg
Я предполагаю, что рассол будет одним из худших способов сбросить эти данные :-). Конечно, это просто догадка. У меня нет жестких данных для его резервного копирования. Говоря о жестких данных, почему бы не провести эксперимент и не выяснить? – mgilson
Ну, я отправляю вопрос не на ответ, я думаю;) Я могу проверить pickle vs hdf5, но что, если эксперт на этом сайте может направить меня к гораздо лучшему методу, который подпадает под «или что-то еще»? :) – denvar