2015-07-19 2 views
0

В основном я следую статье «Использование статистической модели языка для повышения производительности системы распознавания рукописного ввода на основе HMM».Извлечение контуров и ориентаций изображения

Здесь автор выделил вектор из 9 признаков из каждого скользящего окна. со ссылкой на газету:

Первые три функции вес окна, его центр тяжести и второго порядка момент окна.

Особенности четыре и пять определяют положение верхнего и нижнего контура в окне, имеется шесть и семь дают ориентацию верхний и нижний контур градиентом контура в положении окна, имеется восемь дает число от черного до белого переходов в вертикальном направлении, а функция девятая дает число черных пикселей между верхним и нижним контурами.

Мне удалось вычислить первые три функции, о которых идет речь в статье, но у меня, похоже, есть проблемы с пониманием особенностей 4,5,6,7,8.

Я могу рассчитать контур изображения. Предположим, что это окно одной из строк текста (окна имеет длину 14 пикселей, как это было предложено бумаги):

enter image description here

И это извлеченный контур изображения:

enter image description here

Так что же такое верхний и нижний контуры? откуда я могу рассмотреть пределы, если они относятся к верхнему и нижнему пикселам, тогда я мог бы извлечь те, которые не имеют контурной экстракции? Точно так же ориентация этих контуров одинаково запутанна.

Я был бы очень признателен за руководство.

+0

Изображения не видны. Пожалуйста, измените их. – NKN

+0

@NKN Я пробовал его в разных браузерах, и изображения работают на меня. Повторите попытку – ipunished

+0

Вот как я вижу изображения, возможно, все изображение должно быть таким, я понятия не имею. http://pasteboard.co/26C6SF7U.png – NKN

ответ

1

Я взглянул на газету, и я уверен, что «верхний» и «нижний» следует читать как «восходящий» и «самый низкий». Это особенно имеет смысл, поскольку авторы обращают особое внимание на предварительную обработку своих данных, которые они нормализуют как в горизонтальном, так и в вертикальном направлениях. Они заботятся о том, чтобы иметь какую-то устойчивость к масштабу, угол подписи ...

Я думаю, что функции 4 и 5 могут быть экстремальными ординатами контуров, что в сочетании с особенностями 6 & 7, которые являются градиентами = ориентации, дают представление о форме этих частей контура.

Особенность 9, будет в основном полезной, чтобы сделать разницу между буквами, которые могут иметь похожие вертикальные формы, которые я предполагаю, например, «i», «l», «j».

Это мое понимание. Надеюсь это поможет!

+0

Спасибо за ваш ответ. Да, я сделал предварительную обработку, упомянутую в документе. Итак, самые расстроенные и самые низкие значения - это самый верхний пиксель и самый низкий пиксель? Если это так, разве я не мог бы приобрести те из оригинального черно-белого изображения? Почему мне нужно получить контур изображения? – ipunished

+1

Я думаю, что контуры полезны по двум причинам: - Они гарантируют, что на изображении нет артефакта (= изолированный пиксель шума), который может вызвать ошибочные значения функций - Они нормализуют функцию 9, которая «дает количество черных пикселей между верхний и нижний контуры ". Использование контуров позволяет фактически определить количество черно-белых переходов. Поэтому «l» не будет иметь никакого перехода, но «i» будет иметь 2 из-за точки. «s» будет 4. Это другой дискриминант между буквами. Эта 9-ая особенность имеет смысл, если вы используете черные контуры на белом фоне. (напротив изображения в вашем первом посте) – Eskapp