2016-07-08 5 views
0

Я новичок в h2o, и у меня возникают трудности с этим пакетом на r. Я использую Traning и тест набор 5100 и 2300 набли соответственно с 18917 переменными и бинарной мишенью (0,1) Я побежал случайный лес:H2o случайный лесной участок на r

train_h20<-as.h2o(train) 
test_h20<-as.h2o(test) 

forest <- h2o.randomForest(x = Words, 
          y = 18918, 
          training_frame = train_h20, 
          ntree = 250, 
          validation = test_h20, 
          seed = 8675309) 

Я знаю, я могу получить участок logloss или mse или ... как число изменений дерева Но есть ли способ построить изображение самой модели. Я имею в виду окончательное ансамбль, используемый для окончательных предсказаний?

Кроме того, еще один вопрос, в randomForest пакете я мог бы использовать varImp, возвращающей меня, а также абсолютное значение, меры класса конкретных (рассчитывается как среднее снижение точности), я истолковано как класс-относительная мера с переменной значимостью.

varImp матрица, RandomForest пакет:

varImp matrix, randomForest package В h2o пакет я только найти абсолютную меру важности, есть ли что-то подобное?

+0

Лучше всего, чтобы задать свои два вопроса, как два вопроса. (См. Http://meta.stackexchange.com/a/39224/167713, почему.) Для H2O нет случайного участка леса; Я видел совет прочитать исходный вывод POJO! (В любом случае, ничего, кроме игрушечной модели, вы не захотите этого делать.) –

ответ

0

Нет окончательного дерева в конце случайного леса в R с пакетами randomForest. Чтобы сделать окончательную добычу, случайный лес использует метод голосования. Голосование означает, что для любых данных: Например 0;

дерева, которые предсказывают данные как класс 0/общее количество деревьев в лесу

класса 1 оно такое же, как класса 0;

дерева, предсказывающие данные как класс 1/общее количество деревьев в лесу

Однако вы можете использовать Ctree. библиотека ("партия") х < - (. Класс ~, данные = данные) Ctree участок (х)