У меня есть dataframe, который имеет категориальные переменные с сотнями различных значений.Python Pandas Dataframe: заменить переменную на частоту
Я могу проверить частоту этих уровней с использованием «values_count()» функция использования GroupBy о + reset_index() ...
Я пытался заменить эти сотни значений по их (и позже уровни слияния с низкой мощностью). Я пытался подключиться к двум различным кадрам данных (один со значениями, а другой с подсчетами), но у меня проблемы ...
Например, таблица частот будет ниже, примерно 300 записей (все уникальный):
v_catego Time
0 AA 353
1 AAC 136
2 ABB 2
3 ABC 1
4 ACA 13
300 ZZZ 33
оригинальный dataframe:
V_vatego
0 AA
1 AAC
2 ABB
3 AAC
4 DA
5 AAC
................
, где я хотел бы заменить (или добавить еще одну переменную) по значениям 'Время' для каждого экземпляра:
v_catego new_v_catego
0 AA 353
1 AAC 136
2 ABB 2
3 AA 353
4 AAC 136
.................
Я знаю, что в R есть простая функция, которая делает это. Есть ли эквивалент в python?
благодарит за быстрый ответ Jezrael. Я добавил дополнительные комментарии. Я думаю, теперь это яснее ... – mik
Это место! – mik
Супер, удачи! – jezrael