Мне нужно классифицировать изображения в одном из классов 2000.CNN с 2000 классами?
Я использую Nvidia DIGITS + caffe (GoogLeNet) и предоставил образцы 10K для каждого класса (так что колоссальные 20 миллионов изображений, данные ~ 1Tb!). Но сама задача подготовки данных («создать db») составляет 102 дня, и я содрогаюсь, чтобы подумать, каково будет фактическое время обучения, если эта оценка будет правильной.
Каков наилучший способ решения этой задачи? должен ли я разбивать набор данных на 3-4 модели? и использовать их отдельно? Использовать меньший набор данных и подвергать риску меньше точности? что-то другое?
Спасибо, что помогли новичку.
Почему downvote ... Как сказал автор: «Но сама задача подготовки данных (создать db) оценивается в 102 дня», используя ImageDataLayer, у вас нет базы данных creat lmdb и просто используйте txt-файл для обучение. По моему опыту, скорость imagedatalayer также очень быстрая. –