Я разрабатываю алгоритм OCR с использованием нейронной сети. У меня есть 100 изображений ([40x20]) каждого символа, поэтому мой вход должен быть 2600x800. У меня есть вопрос относительно входных данных и целей.Что касается определения входных данных и целей в нейронной сети
1) мой вход правильный? и могут ли все 2600 изображений использоваться в случайном порядке?
2) какой должна быть цель? мне нужно определить цель для всех 2600 входов?
3) как цель для одного и того же символа является одиночной, каков конечный целевой вектор? (26x800) или (2600x800)?
Искреннее спасибо.
Благодарим за ответ. 1) Я планирую применить извлечение функции в будущем, чтобы уменьшить размер моего вектора. но я хочу уменьшить размер изображения до 10x10. я также буду проходить PCA. 2) Можно ли установить целевую матрицу строк? я имею в виду вместо 26x1 для каждого изображения я могу использовать (1x1 char)? –
@SAGARJANI Я не специалист в NN, просто немного поиграл с ними. Насколько я знаю, нет, вы должны использовать двойники. На пиратском выходе вы получите число, близкое к 1 (но не 1 вообще) в правильном знаке, а числа, близкие к нулю, в некорректном. Как правило, вы пытаетесь найти максимальное количество выходов ant, которое было бы признанным персонажем. –