У меня возникла проблема с моей процедурой перекрестной проверки. В настоящее время я просто зацикливаю (повторяю) над моими параметрами (например, C и гамма для RBF SVM) и выполняет внутреннюю перекрестную проверку «Оставшийся один».Вложенная перекрестная проверка действительно необходима?
Конечно, это может привести к предвзятости. Поэтому было бы лучше сделать вложенную перекрестную проверку, например внешнюю перекрестную проверку и внутреннюю 10-кратную перекрестную проверку.
Проблемы в том, что у меня только 37 точек данных, вложенная перекрестная проверка увеличивает время выполнения на много, и я также хочу напечатать, например, для k ближайших соседей k с точностью или количеством скрытых слоев снова точность (для нейронной сети), которая невозможна при вложенной перекрестной проверке.
Действительно ли существует большое смещение без использования вложенной перекрестной проверки или я могу пойти с моим единственным подходом к CV? Есть ли некоторые документы, в которых утверждается, что одна перекрестная проверка одобрена?
Как это может быть медленным только с 37 точками данных? – IVlad
Потому что у меня около 200 000 функций ... И я использую нейронные сети, которые очень медленные. В любом случае, я думаю, что я могу получить лучшие параметры, используя большинство голосов (или среднее). Но как я могу определить количество скрытых слоев или число ближайших соседей против точности? – machinery