2014-11-19 3 views

ответ

6

В этом документе представлен обзор двигателя: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf

Так это выглядит, как вам не нужно, чтобы реализовать оператор кэнни.

Тессеракт использует Оцу пороговый для бинаризации изображения перед обработкой его https://github.com/tesseract-ocr/tesseract/blob/master/ccstruct/otsuthr.h

Edit: Если вы хотите, чтобы увидеть двоичное изображение просто создать новый конфигурационный файл «\ tessdata \ конфиги \», добавьте следующую строку: tessedit_write_images True и обработать ваше изображение: tesseract your_image out your_config_file. Tesseract сохраняет двоированное изображение как tessinput.tif.

+0

Где он хранит файл tessinput.tif? – kiwicomb123

+0

@neoneye @ cortex42 В моем каталоге '\ tessdata \ configs \' у меня есть куча файлов, таких как 'api_config', поэтому, когда вы говорите, что создаете новый файл конфигурации, вы имеете в виду просто дублировать исполняемый конфиг? Как открыть эти файлы, чтобы добавить строку, которую вы предложили? Где я смогу увидеть файл '.tif'? – Joshua

Смежные вопросы