У меня есть кадр данных, который представляет разные классы с их значениями. например:Изменение значения групп с несколькими членами в кадре данных pandas
df=pd.DataFrame(
{'label':['a','a','b','a','b','b','a','c','c','d','e','c'],
'date':[1,2,3,4,3,7,12,18,11,2,5,3],'value':np.random.randn(12)})
Я хочу выбрать ярлыки с values_counts меньше определенного порога, а затем поместить их в один класс т.е. маркировать их как, например, «ноль».
Это мой attemp:
value_count=df.label.value_counts()
threshold = 3
for index in value_count[value_count.values<=threshold].index:
df.label[df.label==index]='zero'
Есть ли лучший способ сделать это?
Умм, я обновил контрольные показатели, мои противоположны. Однако мне нравится ваше решение. :-) – Zero
@JohnGalt, не забудьте «timeit»: 'value_count = df.label.value_counts()';) – MaxU
Да, это имеет смысл сейчас. Благодарю. – Zero