2015-03-24 1 views
0

Я разрабатываю алгоритм OCR с использованием нейронной сети. У меня есть 100 изображений ([40x20]) каждого символа, поэтому мой вход должен быть 2600x800. У меня есть вопрос относительно входных данных и целей.Что касается определения входных данных и целей в нейронной сети

1) мой вход правильный? и могут ли все 2600 изображений использоваться в случайном порядке?

2) какой должна быть цель? мне нужно определить цель для всех 2600 входов?

3) как цель для одного и того же символа является одиночной, каков конечный целевой вектор? (26x800) или (2600x800)?

Искреннее спасибо.

ответ

0
  1. Ваш ввод будет правильным. У вас (я предполагаю) 26 символов и 100 изображений размером 800 для каждого, поэтому матрица выглядит хорошо. В качестве побочного примечания, который выглядит довольно большой размер ввода, вы можете захотеть сделать PCA и использовать собственные значения для обучения или просто уменьшить размер изображений. Я смог тренировать NN с изображениями 10x10, но более крупным - более сложным. Попробуйте, и если он не работает, попробуйте сделать PCA.
  2. (и 3) Конечно, если вы хотите обучить NN, вам нужно дать ему входы с выходами, как еще вы собираетесь его тренировать? Вы должны иметь размер 26x1 для каждого изображения, поэтому выход для обучения должен быть 2600x26. В каждом из выходов вы должны иметь 1 для символьного индекса, который он принадлежит, и ноль в остальном.
+0

Благодарим за ответ. 1) Я планирую применить извлечение функции в будущем, чтобы уменьшить размер моего вектора. но я хочу уменьшить размер изображения до 10x10. я также буду проходить PCA. 2) Можно ли установить целевую матрицу строк? я имею в виду вместо 26x1 для каждого изображения я могу использовать (1x1 char)? –

+0

@SAGARJANI Я не специалист в NN, просто немного поиграл с ними. Насколько я знаю, нет, вы должны использовать двойники. На пиратском выходе вы получите число, близкое к 1 (но не 1 вообще) в правильном знаке, а числа, близкие к нулю, в некорректном. Как правило, вы пытаетесь найти максимальное количество выходов ant, которое было бы признанным персонажем. –