2013-12-17 3 views
0

У меня есть вопрос, который был очень настойчивым для меня. Могу ли я обучить нейронную сеть помеченным набором данных (то есть: набор данных с информацией о цели), а затем применить другой набор данных без метки?Может ли тренировать нейронную сеть с учебным набором с меткой и протестировать ее с помощью набора данных без метки?

Я хочу обучить сеть примерами, которые у меня есть, но тогда в реальной ситуации захотите классифицировать примеры (которые не связаны с мишенью). Например:

Training SET:

Var1 Var2 Var3 Var4 Target 
1  2  3  1  blue 

Испытательная установка (не цель, на самом деле это то, что я хочу знать)

Var1 Var2 Var3 Var4 
1  2  3  1  

The допускают предсказание должен быть синим.

Я использую быстрый шахтер для тестирования нейронных сетей, но вскоре понял, что я не могу применить этот набор тестов, потому что он пропускает метку.

Как я могу решить проблему? Интересно, нужно ли мне исследовать неконтролируемые нейронные сети для этой проблемы, но я честно так не думаю.

вид с уважением.

+1

Ответ на первый вопрос - «да»: обученный классификатор, который требует, чтобы его входы были предварительно помечены, были бы совершенно бесполезны. –

ответ

1

Для наблюдения за обучением вы используете маркированный набор для тренировки любой модели. Затем вы можете использовать модель для прогнозирования меток для немаркированного набора.

Если у вас также есть метки для тестового набора, вы можете сравнить предсказанные значения с метками тестового набора. Таким образом, вы можете оценить ошибку прогнозирования (т. Е. Проверить модель, следовательно, набор тестов имен)

Если вас интересует только прогноз, вам определенно не нужны метки.

1

Применение классификатора (включая nn, например mlp) в наборе данных без метки, является фактическим использованием классификаторов. Но когда вы говорите test, вы имеете в виду, что хотите видеть меры качества, такие как false alarm rate или precision, и для этого вам нужна метка.

Предполагая, что вы хотите обучить классификатор, а затем использовать его в реальном случае, я настоятельно рекомендую вам test с метками данных и попытаться использовать модель с наиболее желательной точностью. В противном случае у вас может быть много ложных предсказаний, которые, конечно же, будут вас беспокоить.

Если у вас только что помеченный набор данных с несколькими образцами в нем, вы можете попробовать k-fold валидации.

Смежные вопросы