Мы используем Tesseract.NET (и версию для Android), чтобы распознавать и извлекать данные документа. Он работал очень хорошо с Arial и Cambria шрифтов, но теперь мы должны признать документы так:Tesseract - проблемы с OCR с шрифтами стиля пишущей машинки
Тессеракт не может распознать его. Абсолютно ничего (кроме серийного номера большого размера в правом верхнем углу).
Мы пытались его обучить, но, возможно, это наша вина - это все еще нестабильно.
Что мы можем сделать?
(Btw шрифт является использование национальных ведомств, мы не можем получить его как истинный тип или другой формат шрифта.
Большое спасибо, мы попробуем. – boj