Автоматическое распознавание текста (OCR) от изображения

Я хочу узнать информацию о питательных веществах от упаковочных этикеток Sample Nutrient label. Это одно изображение пакета, разные бренды могут по-разному стирать/компоновать свои ярлыки. Но я знаю некоторые вещи наверняка, макет будет несколько табличным с определенными ключевыми словами в заголовке, как «Питательный элемент», а также содержание таблицы будет иметь определенные общие слова, такие как Energy/Fat и т. Д. Я хочу извлечь эти значения в текстовую форму и сохранить ее в моем db.Автоматическое распознавание текста (OCR) от изображения

Образец изображения является частью более крупной проблемы, находя контур/поле, которое может содержать этот раздел «Питательная этикетка».

Как я понимаю, это 3 широких шага.

Сканирование входного изображения (передний продукт/назад/сторона изображения), чтобы искать лучший контур, который может быть моя цель контур, содержащий эти NUTRIENT информация
Перейти к этому контуру и выполнить OCR (возможно сохранить макет информация и не выводить все в 1 строке)
сканируйте текст и ищите необходимую информацию.

Я новичок в области распознавания изображений. было бы очень полезно,

Если бы я мог получить обратную связь по моему подходу. например, следует ли искать текст в изображении или собирать похожие изображения и обучать модель, а затем классифицировать? подобно выполнению распознавания лиц.
Если кто-то уже решил эту проблему, было бы здорово получить некоторые указатели (их не забавно изобретать колесо).
Если это проблема исследования, то соответствующие коды/библиотеки/указатели/похожие вопросы SO, на которые я могу ссылаться.

Было бы весьма заметным, если ответы не являются общими (например, выполнять выделение признаков, я бы не понятия, что является выделение признаков, а не указатель образец кода будет удивительным.)

Я благодарю вас за ваше время и помощь.

благодаря Chahat

источник

2016-12-03 user2745862

Было бы необходимо собрать не менее 200-300 изображений для достаточной подготовки.

2/3. Я действительно решил проблему, но это было сделано с использованием не бесплатного решения, поэтому я не должен давать указания здесь.

источник

2016-12-12 03:18:26

Автоматическое распознавание текста (OCR) от изображения

ответ

Смежные вопросы