Следующий код должен делать то, что я хочу, но он занимает 10 гб оперативной памяти к моменту 20% выполнения цикла.DataFrame to Panel, индексированный неодинарным столбцом с Pandas
# In [4]: type(pd)
# Out[4]: pandas.sparse.frame.SparseDataFrame
memid = unique(pd.Member)
pan = {}
for mem in memid:
pan[mem] = pd[pd.Member==mem]
goal = pandas.Panel(pan)
Каковы размеры ('pd.shape') и плотности (' pd.density') в SparseDataFrame? Любые изменения вы можете отправить мне по электронной почте рассол объекта ('pd.save (file_path)'), чтобы я мог попытаться диагностировать, что происходит? Кстати, эти вопросы будут лучше заданы в списке рассылки, чем SO. –
pd.shape = (2668990, 232) –
pd.density = 0.12814551216649045 Файл слишком велик для отправки по электронной почте. –