Повторяющиеся значения в «группе по» панды dataframe

У меня есть следующие панд DataFrame:Повторяющиеся значения в «группе по» панды dataframe

 email cat class_price 
0 [email protected] cat1   1 
1 [email protected] cat2   2 
2 [email protected] cat2   4 
3 [email protected] cat2   4 
4 [email protected] cat2   1 
5 [email protected] cat1   3 
6 [email protected] cat1   2 
7 [email protected] cat2   1 
8 [email protected] cat2   4 
9 [email protected] cat2   2 
10 [email protected] cat3   1 
11 [email protected] cat1   1

И я хочу, чтобы группы по электронной почте и по class_price, для каждой строки я хочу взять максимум из class_price.

Я использую:

test_df2 = test_df.groupby(['email','cat'])['class_price'].max()

Выход:

email    cat 
[email protected] cat1 2 
        cat2 4 
[email protected] cat2 2 
        cat3 1 
[email protected] cat1 3 
        cat2 4

Но как я могу получить результат, где даже сгруппированных столбцы сохраняют повторяющиеся значения, таким образом, что его можно записать в виде правильная таблица со всеми значениями:

email    cat  maxvalue 
[email protected] cat2  2 
[email protected] cat1  2 
[email protected] cat3  3

Примечание: пример вывода несовместим с примером ввода ju написанный для объяснения идеи.

источник

2016-04-17 stackit

Можете ли вы добавить выходные данные из входных данных? Или, возможно, изменить входные данные для лучшего понимания? – jezrael

Вы можете просто сбросить индекс, помещая данные в столбцы.

In [1]: print (test_df2.reset_index(name='maxvalue').to_string(index=False)) 
      email cat  maxvalue 
[email protected] cat1   2 
[email protected] cat2   4 
[email protected] cat2   2 
[email protected] cat3   1 
[email protected] cat1   3 
[email protected] cat2   4

источник

2016-04-17 13:27:16

Повторяющиеся значения в «группе по» панды dataframe

ответ

Смежные вопросы