Я использовал randomForest
метод из пакета «randomForest» в наборе данных тренировки, чтобы увидеть, как он связан с методом дерева регрессии, представленным в пакете «дерево», просто из любопытства. Вот команда:R: дополнительная случайность в randomForest?
rf.fit = randomForest(formula, data = dataTrain, mtry = var, ntree = 1,
replace = FALSE, samplesize = nrow(dataTrain))
где var
это число переменных в формуле. Поскольку все переменные были приняты, выборка была выполнена без замены в полном наборе учебных данных, я думал, что предсказание на тестовом наборе данных выходной модели rf.fit
должно быть последовательным и равным прогнозу по методу дерева. Однако он менялся от раунда к раунду, если семя не было установлено и отличалось от последнего метода. Я смущен, когда возникает дополнительная случайность.
я тестировал 'randomForest' с' iris' набора данных и * делает * производить различные предсказания каждый раз, даже с 'mtry' равно числу предикторных переменных (в этом случае 4),' samplesize = nrow (iris) 'и других параметров, указанных вами. – eipi10