Я пытаюсь научиться работать с файловыми кадрами pandas. В моей DataFrame есть 4 столбца A, B, C, D.Python: сумма данных данных Pandas
Для индекса (A, B, C), существует несколько значений D. я хочу объединить эти строки и суммировать значения в D.
у меня есть:
╔═══╦═══╦═══╦═══╦═══╗
║ ║ A ║ B ║ C ║ D ║
╠═══╬═══╬═══╬═══╬═══╣
║ 1 ║ 1 ║ 2 ║ 3 ║ 5 ║
║ 1 ║ 1 ║ 2 ║ 3 ║ 3 ║
║ 2 ║ 1 ║ 5 ║ 4 ║ 2 ║
║ 2 ║ 1 ║ 2 ║ 4 ║ 2 ║
║ 3 ║ 1 ║ 2 ║ 4 ║ 2 ║
║ 3 ║ 1 ║ 2 ║ 4 ║ 3 ║
╚═══╩═══╩═══╩═══╩═══╝
Хочу чтобы получить:
╔═══╦═══╦═══╦═══╦═══╗
║ ║ A ║ B ║ C ║ D ║
╠═══╬═══╬═══╬═══╬═══╣
║ 1 ║ 1 ║ 2 ║ 3 ║ 8 ║
║ 2 ║ 1 ║ 5 ║ 4 ║ 2 ║
║ 2 ║ 1 ║ 2 ║ 4 ║ 2 ║
║ 3 ║ 1 ║ 2 ║ 4 ║ 5 ║
╚═══╩═══╩═══╩═══╩═══╝
Я пытался сделать это таким образом:
df=df.groupby(['A','B','C'])['D'].sum()
Но вместо этого он дает мне серию.
так вы желая 'ДФ = df.groupby ([ 'A', 'B ',' C ']) [' D ']. Sum(). Reset_index() 'или' df = df.groupby ([' A ',' B ',' C '], as_index = False) [' D '] .sum() ' – EdChum
Да, это работает :) вы можете ответить на него, и я буду отмечать его как решенный – SpeedEX505