2015-05-15 2 views
1

У меня есть ФР так:Python Pandas: Как группировать и подсчитывать и выбирать часть подсчетов?

  new_org    old_org asn cc 
0 85736 pcizzi 85736 - Pcizzi S .a 23201 PY 
1    001    001 Host 40244 US 
2  85736 blah  85736 - whatevs 23201 PY 
3    001  001 IT Complex 55734 IN 
4 001 hospedagem 001 Hospedagem Ltda 36351 US 
5   001web action.us.001web.net 36351 US 

, и я хотел бы GroupBy моего ФРА основан на колонке «ASN» и выберите те группы, которые имеют более одной строки. Вот как я это делаю сейчас, но я не уверен, что это правильно:

df.groupby('asn').apply(lambda x:x.count()>1) 

Может кто-нибудь помочь?

ответ

4

filter a group.

Попробуйте df.groupby('asn').filter(lambda x: len(x) > 1), который вернет вам DataFrame. Вы можете сгруппировать его еще раз, если необходимо.

Смежные вопросы