Я немного изучал нейронные сети и недавно узнал об алгоритме обучения отсева. Там есть отличные документы, чтобы понять, как это работает, в том числе и от авторов.Выбор модели с нейронной сетью отсева обучения
Таким образом, я построил нейронную сеть с тренировкой отсева (это было довольно легко), но я немного смущен тем, как выполнять выбор модели. Из того, что я понимаю, похоже, что выпад - это метод, который будет использоваться при обучении конечной модели, полученной путем выбора модели.
Что касается тестовой части, бумаги всегда говорят об использовании полной сети с уменьшенными весами, но они не упоминают, как использовать ее в части обучения/валидации (по крайней мере, те, которые я читал).
Я думал об использовании сети без отсечения для части выбора модели. Скажите, что заставляет меня понять, что сеть хорошо работает с N нейронами. Затем, для окончательной подготовки (той, которую я использую для обучения сети для тестовой части), я использую 2N нейроны с вероятностью отсева p = 0,5. Это заставляет меня иметь в среднем ровно N нейронов, поэтому большую часть времени вы пользуетесь сетью в нужной емкости.
Правильно ли это?
Кстати, я знаю, что отброс может быть не лучшим выбором с небольшими наборами данных. Проект, над которым я работаю, имеет академические цели, поэтому мне не нужно, чтобы я использовал лучшую модель для данных, если я придерживаюсь хороших практик в обучении машинам.
Прямо к делу. Мне это нравится :) – mp85