2016-08-11 2 views
0

Я моделирую набор данных с использованием случайного классификатора леса. Я хочу напечатать функции, которые выбираются случайным лесом. я использовал feature_importances_ следующим образом:Как распечатать функции после моделирования в случайном лесу?

modelRF.feature_importances_ 

Но он показывает ошибку, как:

NameError: name 'feature_importances_' is not defined

Также с помощью метода «подгонки», он дает ошибку, как:

AttributeError: 'RandomForest' object has no attribute 'fit'

Ниже приведены параметры, используемые в случайном классификаторе леса:

(data, x_cols, y_col, num_trees, method, impurity, max_depth=10, min_instance_per_node=20, min_information_gain=0.01, max_bin=32, feature_subset_strategy=u'auto', seed=123, async_execution=False) 

Я хочу напечатать функции, выбранные с использованием случайного леса.

Нужно ли определить какую-то дополнительную вещь, чтобы эти методы работали в случайном лесу? (Я моделирую RF в распределенной платформе с помощью пакета adatao/arimo).

ответ

0

В пакете arimo имеется модуль с именем variable_importance, который предоставит вам функции, выбранные случайным классификатором леса.

Это даст панд dataframe с variable name, importance score

variable name который имеет importance score> 0,0 является функция выбирается случайным лесной классификатором. Это может использоваться для пакета arimo в python для распределенной платформы.

model.feature_importances_ 

может использоваться иначе для других упаковок.

Смежные вопросы