2016-06-27 2 views
-1

Я знаю, что есть много сообщений о проблемах с объемом памяти mclapply, но все же я пытаюсь выяснить, есть ли что-нибудь, что может помочь моему делу.Эффективная/многопоточная регрессия прогноза

Я подгонка модели случайных лесов к ~ 600 по 60000 (ответ у на переменных матрицы X) матрица:

library(randomForest) 
fit <- randomForest(x=X,y=y) 

Затем я хочу, чтобы сравнить эту подгонку случайной формы и для того что Я делаю это:

library(parallel) 
set.seed(1) 
random.list <- mclapply(1:1000,function(f){ 
    idx <- shuffle(nrow(X)) 
    random.y <- predict(object=fit,newdata=X[idx,],type="response") 
}, mc.cores = ncores) 

К сожалению, это слишком большой объем памяти (требуется более 100GB), что делает его непрактичным.

BTW среда, в которой я работаю, это Linux.

Любые предложения?

ответ

0

Похоже, mclapply2 {snpEnrichment} - разумное легкое решение

Смежные вопросы