7
documentation для Random Forests не включает функции. Однако он указан на Jira, как разрешено, и находится в source code. HERE также говорит, что «Основные отличия этого API и оригинальный MLlib ансамблей API являются:Как использовать значение функции Spark в случайном лесу?
- поддержки DataFrames и ML трубопроводы
- разделения классификации против регрессии
- использование метаданных DataFrame различать непрерывное и категорические особенностей более
- функциональности для случайных лесов: Оценки функции важностью, а также прогнозируемой вероятность каждого класса (а.к.а. класс условных вероятностей) для классификации.»
Однако, я не могу понять синтаксис, который работает, чтобы назвать эту новую функцию.
scala> model
res13: org.apache.spark.mllib.tree.model.RandomForestModel =
TreeEnsembleModel classifier with 10 trees
scala> model.featureImportances
<console>:60: error: value featureImportances is not a member of org.apache.spark.mllib.tree.model.RandomForestModel
model.featureImportances
с новым импортом (RandomForestClassificationModel) - как вы обучаете модель? @Climbs_lika_Spyder – Yaeli778
@ Yaeli778, есть хороший пример того, как обучать модель по адресу https://spark.apache.org/docs/1.5.2/ml-ensembles.html –
Можете ли вы указать, как получить featureImportance от pyspark? – pseudocode