Я ему следующие панд dataframe:вычислить среднее количество уникальных комбинаций в GroupBy панд
data = DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B' : ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C' :[2,1,2,1,2,1,2,1]})
, который выглядит как:
A B C
0 foo one 2
1 bar one 1
2 foo two 2
3 bar three 1
4 foo two 2
5 bar two 1
6 foo one 2
7 foo three 1
Что мне нужно, чтобы вычислить среднее каждой уникальной комбинации A и B. то есть:
A B C
foo one 2
foo two 2
foo three 1
mean = 1.66666667
и имеющий в качестве выходного сигнала 'меня анс вычисляется по значению из A
т.е .:
foo 1.666667
bar 1
Я попытался с:
data.groupby(['A'], sort=False, as_index=False).mean()
но он возвращает меня:
foo 1.8
bar 1
Есть ли способ вычислить mean of only unique combinations
? Как ?
Хм хорошо. Это тоже работа. Может быть, я получаю голос –
@S_A Да, согласен. Ваш ответ так же достоин, как и мой. – LondonRob