2016-01-05 2 views
7

documentation для Random Forests не включает функции. Однако он указан на Jira, как разрешено, и находится в source code. HERE также говорит, что «Основные отличия этого API и оригинальный MLlib ансамблей API являются:Как использовать значение функции Spark в случайном лесу?

  • поддержки DataFrames и ML трубопроводы
  • разделения классификации против регрессии
  • использование метаданных DataFrame различать непрерывное и категорические особенностей
  • более
  • функциональности для случайных лесов: Оценки функции важностью, а также прогнозируемой вероятность каждого класса (а.к.а. класс условных вероятностей) для классификации.»

Однако, я не могу понять синтаксис, который работает, чтобы назвать эту новую функцию.

scala> model 
res13: org.apache.spark.mllib.tree.model.RandomForestModel = 
TreeEnsembleModel classifier with 10 trees 

scala> model.featureImportances 
<console>:60: error: value featureImportances is not a member of org.apache.spark.mllib.tree.model.RandomForestModel 
       model.featureImportances 

ответ

3

Вы должны использовать новый случайный лес. Проверьте импорт. старые:

import org.apache.spark.mllib.tree.RandomForest 
import org.apache.spark.mllib.tree.model.RandomForestModel 

НОВОЙ Случайные Леса использовать:

import org.apache.spark.ml.classification.RandomForestClassificationModel 
import org.apache.spark.ml.classification.RandomForestClassifier 
+0

с новым импортом (RandomForestClassificationModel) - как вы обучаете модель? @Climbs_lika_Spyder – Yaeli778

+1

@ Yaeli778, есть хороший пример того, как обучать модель по адресу https://spark.apache.org/docs/1.5.2/ml-ensembles.html –

+0

Можете ли вы указать, как получить featureImportance от pyspark? – pseudocode

Смежные вопросы