У меня есть dataframe, который я сейчас группирую по категории, в которой у меня около тысячи элементов. Это создает слишком широкую диаграмму, на которой я фактически не интересуюсь большинством данных, так как они все одинаковы.Скрипичный сюжет в R binning большинства групп в «другую» категорию?
Я хочу видеть только графики для элементов, которые превышают пороговое значение в своем максимальном значении, и, возможно, объединить все остальные в «другую» категорию.
Есть ли консервный способ для этого?
Это идеальная отправная точка для меня. fct_lump, в частности, позволяет мне посмотреть на те, для которых у меня больше данных. Я не уверен, как смотреть на те, которые имеют наибольшую дисперсию в измерении. Вы знаете, что это выполнимо? И огромное спасибо! –
Самая высокая дисперсия в пересчете на другую переменную? –
Да. И я мог бы пойти с чем-то более простым, как макс другой переменной. –