2016-10-24 6 views
2

У меня есть dataframe с дублирующимися именами столбцов. Я хочу свернуть все те же записи в один.Свернуть дублирующиеся строки с pandas

CSV-данных данных будет,

id,col1,col2,col1,col2 
'a',1,0,1,0 
'b',0,1,1,0 
'c',1,0,0,0 

В результате я ищу это,

id,col1,col2 
'a',2,0 
'b',1,1 
'c',1,0 

Я хочу просуммировать столбцы.

Я новичок в pandas и не могу найти способ правильно заполнить значения. Обратите внимание, что у меня около 4000 столбцов.

+0

ли первая строка в желаемом результате ошибка? – DSM

+0

Опечатка, я исправил ее. – Stereo

ответ

5

Вы можете использовать groupby по именам столбцов и совокупным sum:

print (df.groupby(level= 0, axis=1).sum()) 
    col1 col2 id 
0  2  0 'a' 
1  1  1 'b' 
2  1  0 'c' 
Смежные вопросы