У меня есть следующие панд DataFrame:Повторяющиеся значения в «группе по» панды dataframe
email cat class_price
0 [email protected] cat1 1
1 [email protected] cat2 2
2 [email protected] cat2 4
3 [email protected] cat2 4
4 [email protected] cat2 1
5 [email protected] cat1 3
6 [email protected] cat1 2
7 [email protected] cat2 1
8 [email protected] cat2 4
9 [email protected] cat2 2
10 [email protected] cat3 1
11 [email protected] cat1 1
И я хочу, чтобы группы по электронной почте и по class_price, для каждой строки я хочу взять максимум из class_price.
Я использую:
test_df2 = test_df.groupby(['email','cat'])['class_price'].max()
Выход:
email cat
[email protected] cat1 2
cat2 4
[email protected] cat2 2
cat3 1
[email protected] cat1 3
cat2 4
Но как я могу получить результат, где даже сгруппированных столбцы сохраняют повторяющиеся значения, таким образом, что его можно записать в виде правильная таблица со всеми значениями:
email cat maxvalue
[email protected] cat2 2
[email protected] cat1 2
[email protected] cat3 3
Примечание: пример вывода несовместим с примером ввода ju написанный для объяснения идеи.
Можете ли вы добавить выходные данные из входных данных? Или, возможно, изменить входные данные для лучшего понимания? – jezrael