У меня есть Pandas DataFrame, который среди столбцов имеет номер, называемый Phone_Number. Я хочу получить только строки с номером телефона, который показывает 50 и более раз. Моя лучшая попытка была такой:Индекс Pandas DataFrame, принадлежащий к набору
counts = data.Phone_Number.value_counts()
counts = counts[counts.values > 50]
data[data.Phone_Number in counts.index]
я, однако, эту ошибку: TypeError: объекты серии 'изменчивы, поэтому они не могут быть хэшированного
Что бы лучший способ, чтобы получить строки в кадр данных для этой ситуации?
спасибо!
Используйте 'ISIN()': http://stackoverflow.com/questions/12065885/ how-to-filter-the-dataframe-rows-of-pandas-by-in-in/26724725 –
Спасибо, @ajcr! Он не выдает ошибку, но я получаю пустой набор, который, как я думал, не был возможен (набор счетчиков не пуст и был сгенерирован из телефонных номеров, содержащихся в «данных») –
Это странно, я бы подумал 'data [data.Phone_Number.isin (counts.index)]' будет работать. Можете ли вы разместить небольшой образец своих данных? –