Я делаю регрессионный анализ для данных со слишком большим количеством категориальных уровней. Интересно, как мне агрегировать значения для нескольких категориальных уровней? Например, давайте иметь данные с двумя столбцами A (категориальный) и B (цифрового):агрегированные значения в R по правилу
A B
1 1
1 0
2 3
2 0
3 1
3 2
4 6
4 0
Теперь я хотел объединить смежные уровни в категорической функции переменной А. агрегации суммирование. Результат должен выглядеть так:
A B
A1-2 4
A3-4 9
Любая помощь приветствуется.
Вы не упомянули, что правило на самом деле. –