2016-05-02 2 views
1

из следующего набора данных: enter image description hereПанды .groupby автоматически selecing столбец

Я пытаюсь использовать .groupby для создания набора, где я получаю среднее положение графа в местоположении пользователя. Я уже сделал это для счетчика следящих средств, используя

groupLoc = df.groupby('User Location') 
groupCount = groupLoc.mean() 
groupCount 

Какое автоматически выбранное расположение пользователя по отношению к счету следящего. Теперь я пытаюсь сделать то же самое для User Location vs Status Count, но автоматически включит счетчик повторов.

enter image description here

Кто знает, как это исправить? Заранее спасибо!

ответ

1

Я думаю, что вам нужно groupby с mean:

print df.groupby('User Location', as_index=False)['Follower Count'].mean() 
    User Location Follower Count 
0   Canada  1654.500000 
1   Chicago  9021.000000 
2  Indonesia  1352.666667 
3   London  990.000000 
4 Los Angeles CA  86.000000 
5   New York  214.000000 
6  Singapore  106.500000 
7   Texas  181.000000 
8    UK  2431.000000 
9  indonesia  316.000000 
10   null  295.750000 

print df.groupby('User Location', as_index=False)['Status Count'].mean() 
    User Location Status Count 
0   Canada 39299.000000 
1   Chicago 6402.000000 
2  Indonesia 12826.000000 
3   London 4864.666667 
4 Los Angeles CA 3230.000000 
5   New York 2947.000000 
6  Singapore 6785.500000 
7   Texas 901.000000 
8    UK 81440.000000 
9  indonesia 17662.000000 
10   null 29610.875000 
+0

Работал как шарм! Спасибо – user3394131

+0

Супер, я пытаюсь улучшить решение 'as_index = False' для возврата' DataFrame'. – jezrael

Смежные вопросы