2016-04-17 2 views
0

У меня есть следующие панд DataFrame:Повторяющиеся значения в «группе по» панды dataframe

 email cat class_price 
0 [email protected] cat1   1 
1 [email protected] cat2   2 
2 [email protected] cat2   4 
3 [email protected] cat2   4 
4 [email protected] cat2   1 
5 [email protected] cat1   3 
6 [email protected] cat1   2 
7 [email protected] cat2   1 
8 [email protected] cat2   4 
9 [email protected] cat2   2 
10 [email protected] cat3   1 
11 [email protected] cat1   1 

И я хочу, чтобы группы по электронной почте и по class_price, для каждой строки я хочу взять максимум из class_price.

Я использую:

test_df2 = test_df.groupby(['email','cat'])['class_price'].max() 

Выход:

email    cat 
[email protected] cat1 2 
        cat2 4 
[email protected] cat2 2 
        cat3 1 
[email protected] cat1 3 
        cat2 4 

Но как я могу получить результат, где даже сгруппированных столбцы сохраняют повторяющиеся значения, таким образом, что его можно записать в виде правильная таблица со всеми значениями:

email    cat  maxvalue 
[email protected] cat2  2 
[email protected] cat1  2 
[email protected] cat3  3 

Примечание: пример вывода несовместим с примером ввода ju написанный для объяснения идеи.

+0

Можете ли вы добавить выходные данные из входных данных? Или, возможно, изменить входные данные для лучшего понимания? – jezrael

ответ

Смежные вопросы