Я использую пакет R's ff
, и у меня есть некоторые объекты ffdf
(размеры около 1.5M x 80), с которыми мне нужно работать. Тем не менее, у меня возникают проблемы с тем, что я использую эффективные операции нарезки/нарезки.Подмножество объектов ffdf в R
Например у меня есть два целочисленных столбцов под названием «ГОД» и «AGE», и я хочу, чтобы сделать таблицу из AGE когда год 2005
Один из подходов заключается в следующем:
ffwhich <- function(x, expr) {
b <- bit(nrow(x))
for(i in chunk(x)) b[i] <- eval(substitute(expr), x[i,])
b
}
bw <- ffwhich(a.fdf, YEAR==1999)
answer <- table(a.fdf[bw, "AGE"])
Операция table()
выполняется быстро, но построение битового вектора происходит довольно медленно. У кого-нибудь есть рекомендации для этого лучше?
Если бы не было `ff`, я мог бы сделать что-то гораздо проще, как` с (подмножество (a.fdf, YEAR == 1999), таблицы (AGE)) `. `ff` - это часть, которая делает ее более сложной. – 2010-12-06 17:17:45