2015-07-13 8 views
1

Я группируя гнилые помидоры оценки режиссера следующим:Фильтрация в панды dataframe

director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False) 

print director_counts ---> 

Director 
Woody Allen    44 
Alfred Hitchcock  38 
Clint Eastwood   32 
Martin Scorsese   29 
Steven Spielberg  29 
Sidney Lumet   25 
... 

Вопрос: Какой самый лучший способ для меня, чтобы фильтровать директоров с более чем 2-х фильмов?

Для фильтрации по средним фильмам для режиссера это будет работать? bigbadpanda.groupby(["Director"]).size().mean())

+0

Вы можете разместить исходные данные здесь? Возможно, более оптимальный подход к тому, что вы делаете. – Manhattan

+0

Я только что проверил документацию в разделе «фильтрация». Попробуйте следующее: 'director_counts.groupby (director_counts [" Director "]). Filter (lambda: x: x> 2)' для фильтрации по> 2 фильмам. Я добавлю к этому через секунду –

ответ

1

данных я создал на основе вашей информации

Director,Movies 
Woody Allen,44 
Alfred Hitchcock,38 
Clint Eastwood,32 
Someone,2 
Someone else,1 

Просто сделать это:

df = pd.read_csv('data.txt') 

print(df[df.Movies > 2]) 

Выход:

  Director Movies 
0  Woody Allen  44 
1 Alfred Hitchcock  38 
2 Clint Eastwood  32 
Смежные вопросы