Мне сложно фильтровать groupby
элементов в пандах. Я хочу сделатьsql выбрать группу по счету (1)> 1 эквивалент в python pandas?
select email, count(1) as cnt
from customers
group by email
having count(email) > 1
order by cnt desc
Я сделал
customers.groupby('Email')['CustomerID'].size()
, и это дает мне список сообщений электронной почты и их соответствующих подсчетов правильно, но я не в состоянии достичь having count(email) > 1
части.
email_cnt[email_cnt.size > 1]
возвращает 1
email_cnt = customers.groupby('Email')
email_dup = email_cnt.filter(lambda x:len(x) > 2)
дает всю запись клиентов с email > 1
, но я хочу агрегированный таблицу.