Найти min, max и среднее значение ID в Python Pandas

У меня есть два Dataframes в Python Pandas. Предположим, что первый из них - df1. Нет необходимости, чтобы столбец идентификатора был заказан.Найти min, max и среднее значение ID в Python Pandas

Тогда второй dataframe df2 имеет столбец с уникальными значениями id

Я хочу, чтобы вычислить минимальное, максимальное и среднее значение столбца B для каждого id и добавить его к второй блок данных. Результат будет выглядеть так:

id min max avg 
0 1 5 7 5.75 
1 2 .. 
2 3 .. 
3 4 ..

В этом примере, я был в состоянии повторить его путем расчета их для каждого id руководства. Это не проблема, поскольку в примере есть только 4 идентификатора. Но мой реальный пример имеет более 1000 идентификаторов. Есть ли какой-либо автоматический способ сделать это?

источник

2015-10-06 Tasos

Использование agg функции на группах

In [96]: df.groupby('id')['B'].agg([pd.np.min, pd.np.max, pd.np.mean]) 
Out[96]: 
    amin amax  mean 
id 
1  5  7 5.750000 
2  5  6 5.666667 
3  7  7 7.000000 
4  6  7 6.666667

источник

2015-10-06 08:52:45 Zero

Вы можете просто сделать 'df.groupby ('идентификатор') [ 'B']. AGG ([ 'мин', 'Макс', 'средний']) 'here – EdChum

Правда, я давал намек, что вы можете использовать numpy funcs для agg. – Zero

Я думаю, это трудно понять, пока вы не попробуете, какие ufuncs уже отображают из строки в их np эквиваленты – EdChum

Найти min, max и среднее значение ID в Python Pandas

ответ

Смежные вопросы