У меня есть таблица в панд/питона и я делаю следующее:.Подсчет уникальных значений в панд сгруппированных объекта
grouped_data = df_comments_cols [ 'article_id'] GroupBy (df_comments_cols [ 'user_id'])
Теперь, чтобы подсчитать количество статей для каждого пользователя я следующее:
ct_grouped_data = grouped_data.count()
Приведенное выше количество идентификаторов товаров для каждого пользователя. Однако иногда есть несколько одинаковых идентификаторов статей для каждого пользователя (в том смысле, что пользователь взаимодействовал с этой статьей более одного раза), и я только хочу считать уникальные идентификаторы статей для каждого пользователя - есть ли быстрый способ сделать это?
Заранее спасибо.
Я открывших [GitHub вопрос для документирования «скрытые» методы, как это] (https://github.com/pydata/pandas/issues/4500). Я наткнулся на это сам, просто попробовав его. –
Ницца спасибо за это – user7289