2013-12-17 3 views
0

Я строю классификатор изображений, который использует функцию DBN для обучения функций и логистическая регрессия для точной настройки результирующей сети. Как правило, наиболее удобным способом реализации такой архитектуры в SciKit Learn является использование класса Pipeline. Но в моем случае у меня есть ~ 10K немеченых изображений и только ~ 300 помеченных. Конечно, я хочу использовать все изображений для тренировки DBN и соответствия логистической регрессии с только помечены примеров.Объединение помеченных и немаркированных данных в одном конвейере

Я могу подумать о реализации моего собственного класса Pipeline, который будет обрабатывать этот случай, но сначала я хотел бы знать, есть ли уже что-то существующее. Это?

ответ

2

Текущий API-интерфейс Pipik-learn API не подходит для контролируемого обучения с неконтролируемым предварительным обучением. Реализация собственного класса-обертки, вероятно, является лучшим способом продвижения вперед в этом случае.

Смежные вопросы