2016-06-07 2 views
0

Я ищу случайный пакет леса в python или R, который позволит мне получить мелкие детали в конечном лесу, который был построен. В частности, я хотел бы:Сведения о деревьях в случайном лесу

  1. Получить некоторое представление о деревьях, созданных;
  2. Для каждого дерева в лесу получите общую оценку того, насколько хорошо он соответствует данным (например, энтропия);
  3. Для каждой записи в учебном наборе и каждом дереве в лесу, запись о том, в каком конце он попал; и
  4. Для новой записи, и для каждого дерева в лесу, запись которого терминал лист заканчивается в.

Я понимаю, что решение (4) будет также работать в качестве решения (3), но я предполагаю, что (3) следует относительно легко сделать, сохранив вклад в результаты по мере роста леса.

Я смотрел довольно сложно на доступные опции как в R, так и на python, и я не могу найти готовый режим, который предоставляет все четыре из этих требований. (Трудно найти тот, который удовлетворяет условию (1) фактического разрешения увидеть лес напрямую.)

Если кто-нибудь знает о чем-то, что я пропустил, или сам создал такую ​​рутину, я бы очень как ссылка/ссылка на него.

ответ

0

Попробуйте это:

Пакет для интерпретации scikit-Learn: Дерево решений и случайные леса предсказания. Позволяет разложить каждое предсказание на смещение и компоненты компонента компонента, как описано в http://blog.datadive.net/interpreting-random-forests/. Для набора данных с n функциями каждое предсказание по набору данных разлагается как предсказание = смещение + свойство_1_contribution + ... + feature_n_contribution.

pip install treeinterpreter 

http://blog.datadive.net/random-forest-interpretation-with-scikit-learn/

+0

Хммм - никогда не видел этого раньше. Спасибо за подсказку; Я это проверю. –

+0

NP. Скоро увидимся!! – Merlin

0

Другим решением является lime, он объяснит веса признаков для прогнозирования, и имеет визуализируя Объяснение с помощью Matplotlib которой интеграция с jupyter (IPython) ноутбука легко.

Смежные вопросы