Здесь достаточно задать вопрос о панде.Агрегирование данных четырьмя различными способами
У меня есть DataFrame сделок:
Customer Date Amount
Angus 2009-07-18 $76.46
Bruno 2009-07-21 $68.66
Danno 2009-07-25 $73.52
Chapp 2009-07-11 $56.04
Chapp 2009-07-21 $11.30
Frank 2009-07-07 $52.86
Chapp 2009-07-09 $97.82
Danno 2009-07-11 $84.98
(etc. for thousands of lines)
Я хотел бы создать четыре DataFrames из этих данных:
- Для каждого клиента, имя клиентов, сколько сделок они уже и суммы Сумм этих сделок
- Для каждого клиента указаны дата и сумма их последней транзакции.
- Для каждого клиента указаны дата и сумма их первой транзакции.
- Для каждого клиента - дата и сумма их наибольшей (суммарной) транзакции.
Можете ли вы посоветовать мне соответствующий код?
(ответы по линиям «Почему вы используете DataFrames? Вы должны использовать ThnargLopes для этого!» Будет тепло встречен.)
Странно похожий на мой первый вопрос на этом сайте: http://stackoverflow.com/questions/9588331/simple-cross-tabulation-in-pandas –
Множественные агрегатные функции! Я не знал об этом. Благодарю. –
Yup - это была моя реакция - я знал, что это возможно - просто не мог пробиться сквозь множество доступных возможностей, чтобы понять, как ... Это фантастическая библиотека ... так рада, что я ее нашел –