2016-11-27 3 views
1

У меня есть панд dataframe, что структурно выглядит следующим образом:панды dataframe сумма с GroupBy

[ 
    ['x', '1', '-7'] 
    ['x', '2', '-2'] 
    ['y', '3', '-1'] 
    ['y', '4', '-3'] 
] 

Я должен GroupBy первый столбец (со значениями x и y с) и найти сумму для второго и третьего столбец для каждого x и y, как это:

[ 
    ['x', 3, -9] 
    ['y', 7, -4] 
] 

Как я могу сделать это с помощью панд?

+1

Вы пытались использовать 'groupby' и' sum' ??? –

ответ

1

установка
я преобразовал свои строки чисел в реальные цифры

df = pd.DataFrame(
    [ 
     ['x', '1', '-7'], 
     ['x', '2', '-2'], 
     ['y', '3', '-1'], 
     ['y', '4', '-3'] 
    ] 
) 

df[1] = pd.to_numeric(df[1]) 
df[2] = pd.to_numeric(df[2]) 

раствор

df.groupby(0).sum() 

enter image description here

Смежные вопросы