Итак, у меня возникли проблемы с пониманием того, как выполняется перекрестная проверка в машинное обучение для построения модели.Как выполняется перекрестная проверка для тестирования?
Предположим, у меня есть набор данных со 100 образцами, и я выполняю проверку в 10 раз.
Из того, что я понимаю, я бы разделил набор данных на множества из 10 и взял 9 из этих наборов для обучения и тестирования на одном из этих наборов.
В конце концов, у меня было бы 10 различных классификаторов и результаты прогнозирования для всего набора данных.
Как бы использовать эти результаты для тестирования на новом 101-м примере?
Раньше мне говорили, что эти 10 разных классификаторов были просто усреднены, и результат используется для тестирования новой точки данных, но как именно это делается? Все 10 классификаторов работают на новом datapoint, а значение доверия в конце усреднено, чтобы получить окончательный, который используется для классификации? Или 10 сгенерированных классификаторов каким-то образом объединены в один? Я думал, что это второй случай, но теперь, когда я думаю об этом, я не уверен, как именно вы «объединили» разные классификаторы.
Итак, предположим, что я использую Weka для создания чистых классификаторов. Что означает, что модель, получаемая с помощью установки перекрестной проверки, означает? Это происходит от начальной загрузки? – xhassassin
Вы пробовали посмотреть документацию Уки? – PureW