2017-02-02 3 views
1

Я пытаюсь извлечь текст из изображений с помощью инструмента tesseract. Однако для определенных изображений tesseract не может обнаружить текст. Я попытался следить за страницей improve the quality of the output, но напрасно. Я приложил образец изображения, для которого tesseract не удалось. Пожалуйста, дайте мне знать любые другие указатели, которые помогут мне улучшить качество выпуска.
Я использую pytesseract для его автоматизации.Невозможно извлечь текст из изображений с помощью tesseract

enter image description here

ответ

1

Тессеракт Известен испытывают трудности с текстом на фоне изображения, например, в вашей меме. Поэтому вам понадобится предварительная обработка, чтобы удалить текст из фона. Если вы открыты для использования OCR api, попробуйте Google Cloud-версию или OCR.space, оба отлично работают с изображениями, подобными этому.

enter image description here

Накладка из ocr.space.

Смежные вопросы