Я читал, что встроенные методы ансамбля в sklearn используют деревья решений в качестве базовых классификаторов. Возможно ли использовать пользовательские классификаторы?Как использовать пользовательские классификаторы в ансамблевых классификаторах в sklearn?
5
A
ответ
3
Если вы имеете в виду случайные классы леса, то нет, в настоящее время это невозможно. Возможность разрешить другие оценки обсуждалась в списке рассылки scikit-learn в январе прошлого года, но я не думаю, что какой-либо фактический код вышел из этой дискуссии.
2
Я не знаю, если это поможет, но вы можете очень легко складывать/объединить пользовательские классификаторы с помощью утилиты Pipeline: http://scikit-learn.org/stable/tutorial/statistical_inference/putting_together.html#pipelining
3
Если вы используете sklearn.ensemble.AdaBoostClassifier
, то ответ да: scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html Вы можете назначить base_estimator самостоятельно.
Трубопроводы не являются ансамблевыми методами. Они объединяют только один классификатор с серией шагов предварительной обработки. –
Да, вы правы. Но я имел в виду, что использование Pipelining и FeatureUnion может использоваться вместе для объединения однородных или гетерогенных моделей в несколько строк кода. Например, Ramp https://github.com/kvh/ramp использует этот принцип. – user1151446