2014-01-24 15 views
3

я создал отдельные группы моих данных, используя следующие операторы:Как сохранить панд группы для отдельных файлов

df = pd.read_csv(file_path) 

grouped = df.groupby(df.some_parameter) 

Что бы я тогда хотел бы сделать (в псевдо-код):

for name, group in grouped: 
    'Some Text' + name = group 
    write to csv 

Конечный результат - отдельный .csv-файл каждого фрагмента исходного набора данных.

ответ

7

Вы были почти там

for name, group in grouped: 
    group.to_csv(path_to_disk) 
2

Этот ответ был очень полезным для меня - спасибо @mkln.

Я просто хотел добавить что-то конкретное к моему собственному случаю использования, которое относится к исходной точке имен файлов («Some Text» + name = group).

Вы можете добавить имя и дополнительный текст, например текущую дату, к каждому имени файла csv, поэтому я создам функцию для возврата текущей даты, а затем использую ее для имени файла.

Поэтому:

from datetime import datetime 

def cur_date(): 
    return datetime.now().strftime("%Y-%m-%d") 

for name, group in grouped: 
    group.to_csv('{}_{}.csv'.format(name, cur_date())) 
Смежные вопросы