2015-03-06 3 views
1

Если я создаю прогноз погоды, который будет прогнозировать, если это будет снег завтра, очень легко сразу ответить, сказав «НЕТ».Какой классификатор используется в следующем сценарии?

Очевидно, что если вы оцениваете такой классификатор в каждый день года, это будет правильно с точностью до 95% (учитывая, что я его создаю и проверяю в регионе, где он очень редко идет снег).

Конечно, это такой глупый классификатор, даже если он имеет точность 95%, потому что, очевидно, более важно предсказать, будет ли снег в зимние месяцы (январь & февраль), в отличие от каких-либо других месяцев.

Итак, если у меня есть много функций, которые я собираю в предыдущий день, чтобы предсказать, будет ли на следующий день снег или нет, учитывая, что будет функция, которая говорит, какой месяц/неделя года она , как я могу взвесить эту конкретную функцию и разработать классификатор для решения этой практической проблемы?

ответ

2

Конечно, это такой глупый классификатор, даже если он имеет точность 95%, потому что, очевидно, более важно, чтобы предсказать, если это будет снег в течение зимних месяцев (январь & февраль), в отличие от любого другого месяцы.

Точность не может быть лучшим измерением для использования в вашем случае. Рассмотрим использование precision, recall и F1 score.

Как я могу взвесить эту конкретную функцию и разработать классификатор для решения этой практической проблемы?

Я не думаю, что вы должны взвешивать какую-либо конкретную функцию в любом случае. Вы должны позволить вашему алгоритму сделать это и использовать cross validation, чтобы определить наилучшие параметры для вашей модели, чтобы избежать переуплотнения.

Если вы говорите, что jan и feb являются наиболее важными месяцами, подумайте только о применении вашей модели в течение этих двух месяцев. Если это невозможно, изучите задание различных весов для классов (собирается дождь/не доходит до дождя), исходя из их числа. This question обсуждает эту проблему - концепция должна быть понятной независимо от выбранного вами языка.

Смежные вопросы