2016-02-25 3 views
0

Если у меня есть набор данных с событиями, в которых каждое событие имеет данные с 1000 возможными элементами, и только 100 являются правильными для каждого события. Как заставить мой классификатор выбрать только 100 для каждого события?Силовой классификатор для выбора фиксированного количества целей

После того, как я запускаю его через свою учебную модель (с 18 функциями и всегда имеет 100 целей/событий, отмеченных как 1), классификатор выбирает где угодно между 60-80 элементами вместо 100. Даже если я даю каждому событию номер события, не помогает.

Я использую метод повышения градиента python sklearn и случайный метод леса.

ответ

1

Просто сделайте это сами. Каждый классификатор в scikit-learn дает вам доступ к решению_функции или pred_proba, обе из которых являются поддержкой для операции прогнозирования (предсказать это просто argmax из них). Таким образом - просто выберите 100 с максимальной поддержкой.

+0

Это дает мне меньше 100, есть ли способ увеличить его? – WhoIsNinja

+0

нет такой вещи, как «предоставление ниже». Он (используя 'decision_function' или' predict_proba') дает вам ** непрерывный ** ответ для каждого класса. Просто выберите 100 с наивысшим. Всегда есть 100 крупнейших (а также 200, 500 или 1000). – lejlot

+0

Получил это - я думал о комбинации прогноза и принятия решения, спасибо - оцените его! – WhoIsNinja

Смежные вопросы