2015-07-06 6 views
1

Когда я использую pandas DataFrame, то есть Ошибка памяти. строкаPython, Ошибка памяти при создании dataframe

Дейты является 200000 и столбец 30. (тип: список) fieldnames1 имеет название колонки. (тип: список)

произошла ошибка в:

df = pd.DataFrame(data,columns=[fieldnames1]) 

что я должен делать? (версия python 2.7 32bit)

+0

У вас закончилось ОЗУ. Попытайтесь использовать меньше данных для тестирования и комбинацию большего количества ОЗУ, 64-битной ОС и 64-битного Python. –

+0

По какой причине вы не используете 64-битную версию python? Также хранение списков в df немного странно – EdChum

ответ

2

Как указано Клаусом, у вас заканчивается память. Проблема возникает, когда вы пытаетесь вытащить весь текст в память за один раз.

Как указано in this post от Wes McKinney, «решение состоит в том, чтобы прочитать файл в меньших частях (используйте iterator=True, chunksize=1000), затем соедините с pd.concat».

0

Вы можете попробовать эту строку кода:

data=pd.DataFrame.from_csv("train.csv") 

Это дублер read.csv но возвращает объект фрейма данных, не давая какой-либо ошибки памяти PS размер обучающих данных составляет около 73 Мб

Смежные вопросы