Определенные столбцы в моем кадре данных содержат кортежи. Всякий раз, когда я выполняю агрегацию через группу по этим столбцам, они не отображаются в результирующем фрейме данных, если явно не указано.Pandas tuples groupby aggregation
Пример,
df = pd.DataFrame()
df['A'] = [1, 2, 1, 2]
df['B'] = [1, 2, 3, 4]
df['C'] = map(lambda s: (s,), df['B'])
print df
A B C
0 1 1 (1,)
1 2 2 (2,)
2 1 3 (3,)
3 2 4 (4,)
Если я следующим образом, то столбец C
не появляется в агрегации
print df.groupby('A').sum()
B
A
1 4
2 6
Но если указать это явно появляется, как ожидается,
print df[['A', 'C']].groupby('A').sum()
C
A
1 (1, 3)
2 (2, 4)
Не могли бы вы рассказать мне, почемуСтолбецне появился в первом случае?
Хотелось бы, чтобы это по умолчанию.
вы не забыли 'C' как в' df.groupby ('A') [ 'C'] сумма() ' ? –
Я мог бы определенно чего-то упустить, но я не знаю, что именно. Хорошо, позвольте мне добавить дополнительный столбец 'df ['D'] = [5, 6, 7, 8]'. Тогда я хотел бы получить вывод 'df.groupby ('A'). Sum()', чтобы иметь все три столбца 'B',' C' и 'D', но я получаю' B' и 'D' только не 'C'. – TruLa