2016-09-28 2 views
0

Я работаю с массивным файлом excel (14 ГБ), который мне нужно очистить, так что осталась только информация, которая мне нужна. Я сделал файл в Chunks, поэтому мой компьютер перестанет терпеть крах, но теперь вам нужно создать новую базу данных, которая отображает только данные для города, который я ищу.Создайте новую базу данных из chunk reader в pandas

Я сделал это, чтобы напечатать (фрагмент)

for chunk in reader: 
    print(chunk) 

не уверен, как продолжить, я пытался

df = reader 
df = reader[reader.SitusCity == Miami] 

Но получить этот код ошибки:

--------------------------------------------------------------------------- 
AttributeError       Traceback (most recent call last) 
<ipython-input-7-d4c11720d1c5> in <module>() 
----> 1 df = reader[reader.SitusCity == Miami] 

AttributeError: 'TextFileReader' object has no attribute 'SitusCity' 

Помощь! !!

+0

Не уверен, почему вы сделали буквально все сниппет, но это для HTML и JS, не Python и ошибок стеки –

ответ

0

попробовать это:

chunk in reader: 
    chunk.ix[chunk.SitusCity == 'Miami'].to_excel('output.xlsx', mode='a') 
Смежные вопросы