2017-02-07 4 views
0

У меня есть следующий код:панда: Подсчитайте не-дублируют элементы при использовании заполнителя

data_agg_df = data_df.groupby("team", as_index=False).player.agg({"player_set": lambda x: set(list(x)), "player_count": "count"}) 

data_agg_df 

Тогда я заметил, выход player_count является значением list(x), не set(list(x)). Как подсчитать не дублированных игроков, т. Е. set(list(x))? Большое спасибо!

ответ

1

Если я правильно понимаю, вы можете использовать nunique, чтобы получить количество уникальных игроков:

data_agg_df = data_df.groupby("team", as_index=False).player.agg({"player_set": "nunique", "player_count": "count"}) 

Если вы хотите массив уникальных игроков, использовать unique вместо nunique таким же образом, как описано выше.

Смежные вопросы