Допустим, у меня есть данные:GroupBy с комбинациями категориальных переменных
pd.DataFrame({'index': ['a','b','c','a','b','c'], 'column': [1,2,3,4,1,2]}).set_index(['index'])
, который дает:
column
index
a 1
b 2
c 3
a 4
b 1
c 2
Тогда, чтобы получить среднее для каждой подгруппы можно было бы:
df.groupby(df.index).mean()
column
index
a 2.5
b 1.5
c 2.5
Тем не менее, что я пытался достичь без постоянного циклирования и резки данных, как получить среднее значение для пар subgr невный?
Например, среднее значение & b составляет 2? Как будто их ценности были объединены.
выход будет что-то похожее на:
column
index
a & a 2.5
a & b 2.0
a & c 2.5
b & b 1.5
b & c 2.0
c & c 2.5
Предпочтительно это предполагает манипулирование параметров в «GroupBy», но, как это, мне приходится прибегать к перекручиванию и нарезки. С возможностью построения всех комбинаций подгрупп в какой-то момент.
Я оставлю это здесь, если он не получит достаточного ответа – Rambatino