2016-11-27 3 views
0

У меня есть кадр данных, в котором переменная, которая должна быть предсказана, имеет 28 возможных коэффициентов.Как выполнить сборку в модели классификатора в R

Теперь я запускаю три алгоритма классификатора в наборе обучающих данных, которые являются носителями векторных машин (SVM), случайным лесом (RF) и ближайшим соседом k (kNN).

Теперь у меня есть три вектора прогнозирования, соответствующие трем описанным выше алгоритмам. Все они имеют хорошую точность около 80-90%.

Я хочу объединить их и предсказать конечную переменную результата на основе системы голосования по трем алгоритмам. Примечание: SVM имеет максимальную точность, за которой следуют RF, а затем kNN. Например:

SVM prediction | RF prediction | KNN prediction|Final outcome 
---------------|---------------|---------------|------------- 

A    |A    |C    |A 
---------------|---------------|---------------|------------- 


D    |J    |D    |D 
---------------|---------------|---------------|------------- 

C    |C    |C    |C 

---------------|---------------|---------------|------------- 
I    |F    |K    |I (pick SVM's outcome in case of a tie) 

Как вы можете видеть, что я хочу, это очень просто. Как я могу выполнить это в R-программировании? И есть ли другой способ исполнения ансамблевого моделирования в этой ситуации?

ответ

0

Существует статистический термин для народного голосования: Режим

SVMprediction <- c('A','D','C','I') 
RFprediction <- c('A','J', 'C','F') 
KNNprediction <- c('C','D', 'C','K') 
data <- data.frame(SVMprediction, RFprediction , KNNprediction) 

### Create the function. 
getmode <- function(v) { 
uniqv <- unique(v) 
uniqv[which.max(tabulate(match(v, uniqv)))] 
} 

apply(data,1,getmode) 

[1] "A", "D", "C", "Я"

Таким образом, можно использовать его для п числа анкетирование предикторов

Помогает ли это?

+0

Спасибо @Harry. Это сработало, и я думаю, что теперь я буду использовать его как стандартную функцию для ансамбля различных предикторов. –

+0

Еще одна вещь, знаете ли вы какую-либо лучшую технику для моделей ансамблевого классификатора? –

Смежные вопросы