Я хочу узнать информацию о питательных веществах от упаковочных этикеток Sample Nutrient label. Это одно изображение пакета, разные бренды могут по-разному стирать/компоновать свои ярлыки. Но я знаю некоторые вещи наверняка, макет будет несколько табличным с определенными ключевыми словами в заголовке, как «Питательный элемент», а также содержание таблицы будет иметь определенные общие слова, такие как Energy/Fat и т. Д. Я хочу извлечь эти значения в текстовую форму и сохранить ее в моем db.Автоматическое распознавание текста (OCR) от изображения
Образец изображения является частью более крупной проблемы, находя контур/поле, которое может содержать этот раздел «Питательная этикетка».
Как я понимаю, это 3 широких шага.
- Сканирование входного изображения (передний продукт/назад/сторона изображения), чтобы искать лучший контур, который может быть моя цель контур, содержащий эти NUTRIENT информация
- Перейти к этому контуру и выполнить OCR (возможно сохранить макет информация и не выводить все в 1 строке)
- сканируйте текст и ищите необходимую информацию.
Я новичок в области распознавания изображений. было бы очень полезно,
- Если бы я мог получить обратную связь по моему подходу. например, следует ли искать текст в изображении или собирать похожие изображения и обучать модель, а затем классифицировать? подобно выполнению распознавания лиц.
- Если кто-то уже решил эту проблему, было бы здорово получить некоторые указатели (их не забавно изобретать колесо).
- Если это проблема исследования, то соответствующие коды/библиотеки/указатели/похожие вопросы SO, на которые я могу ссылаться.
Было бы весьма заметным, если ответы не являются общими (например, выполнять выделение признаков, я бы не понятия, что является выделение признаков, а не указатель образец кода будет удивительным.)
Я благодарю вас за ваше время и помощь.
благодаря Chahat