2014-11-17 4 views
1

Понятно, что я делаю неправильно?HDFStore start stop not working

Я экспериментировал с пандами HDFStore.select начать и остановка варианты, и это не делает разницы.

Команды Я использую являются:

import pandas as pd 
hdf = pd.HDFStore(path % 'results') 
len(hdf.select('results',start=15,stop=20)) 

в надежде получить длину 4 или 5, или однако засчитан, но это дает мне всю чертову dataframe.

Вот скриншот: enter image description here

+0

Это ошибка в настоящее время в фиксированном магазине: https://github.com/pydata/pandas/issues/8287; тянуть запросы приветствуются. вы можете использовать это в хранилище табличных форматов, что в любом случае является более гибким. – Jeff

+0

эй спасибо Джефф. У меня все еще есть одна проблема, которую я бы оценил. Кажется, я получаю странную ошибку при запуске format = 'table', и я не могу отправлять более одного вопроса на SO каждые 90 минут, так что вот скриншот: https://www.dropbox.com/s/ lc06nmitdu29vek/Скриншот% 202014-11-16% 2017.33.02.png? dl = 0 – user3659451

+0

Я бы сказал, что ваш файл поврежден, возможно, его прервали, написав его (это предостережение с этими файлами, это очень быстро, но вы можете только пишите с помощью 1 процесса/потока AT TIME). и если вы прерываете операцию, они могут быть повреждены, поскольку они пишут метаданные в файл и т. д. Я очень редко вижу подобные вещи. Удалите файл и повторите попытку. – Jeff

ответ

1

При записи в файл h5, выберите pandas.to_hdf(<path>,<key>,format='tables'), который позволяет подмножества в магазине, чтобы выбрать. Однако это ошибка, так как вы должны получить сообщение об ошибке.

Согласно Джеффу (https://stackoverflow.com/users/644898/jeff),

это известная ошибка и есть исправление здесь: запросы github.com/pydata/pandas/issues/8287

Напряжения приветствовать.

+0

Формат по умолчанию - 'fixed' – user3659451