агрегированные значения в R по правилу

-3

Я делаю регрессионный анализ для данных со слишком большим количеством категориальных уровней. Интересно, как мне агрегировать значения для нескольких категориальных уровней? Например, давайте иметь данные с двумя столбцами A (категориальный) и B (цифрового):агрегированные значения в R по правилу

Теперь я хотел объединить смежные уровни в категорической функции переменной А. агрегации суммирование. Результат должен выглядеть так:

A  B 
A1-2 4 
A3-4 9

Любая помощь приветствуется.

источник

2016-02-23 Parallax

Вы не упомянули, что правило на самом деле. –

Базовый метод R:

aggregate(B ~ A, data=transform(dat, A=cut(A,c(0,2,4),labels=c("A1-2","A3-4"))), FUN=sum) 

#  A B 
#1 A1-2 4 
#2 A3-4 9

источник

2016-02-23 06:07:04 thelatemail

Да, это тоже работает, и это несколько проще. Также регулируемый диапазон отличен, по крайней мере, я понимаю, как его изменить. – Parallax

Мы могли бы использовать data.table. Преобразуйте 'data.frame' в 'data.table' (setDT(df1)), создайте новую переменную группировки, используя %/% на основе значений в 'A'. Затем, сгруппированные по «A1», мы получаем sum «B», а также paste элементы unique в «A» вместе. Если это не требуется, переменной группировки «A1» можно присвоить значение NULL.

library(data.table) 
setDT(df1)[, A1:= (A-1)%/%2 +1][, 
    list(A= paste0("A",paste(unique(A), 
      collapse="-")), B= sum(B)) ,A1][,A1:= NULL][] 
#  A B 
#1: A1-2 4 
#2: A3-4 9

источник

2016-02-23 05:51:33 akrun

агрегированные значения в R по правилу

ответ

Смежные вопросы