У меня есть фрейм даты df, скажем, с 5 столбцами: a, b, c, d, e.Обработка повторяющихся строк в python
a b c d e
1 6 x 8 3
2 3 y 2 3
3 5 d 1 1
3 4 g 3 4
5 3 z 3 1
Это то, что я хочу сделать, для всех строк с одинаковым значением столбца а, я хочу отказаться от дубликатов, но значение столбца б следует суммировать по этим строкам, так и для остальных столбцов , Я хочу сохранить первое значение.
Окончательный кадр данных будет:
a b c d e
1 6 x 8 3
2 3 y 2 3
3 9 d 1 1
5 3 z 3 1
Как это сделать?
Вы можете использовать в 'метода pandas.DataFrame.groupby' для сбора строк, соответствующих уникальным значениям в любом столбце, а затем использовать метод aggregate объекта groupby для их суммирования. Но это может плохо работать для столбца 'c', поскольку оно содержит строки. Возможно, вам придется обрабатывать это отдельно. –