2017-01-02 4 views
1

Я использую Tess-two для документов OCR. Кажется, что команда Tesseract проделала отличную работу, и результаты очень хорошие!
Но теперь я хочу использовать только слова из файла user_data.
Здесь https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#config-files-and-augmenting-with-user-data - очень хороший пример. Я нашел каждый файл в моем проекте Android, который предлагает ссылка Tesseract, но я не могу заставить программу использовать слова из файла user_data. Я нашел файл .bazaar в папке configs, но как я установил это в своем коде?
Есть ли что-то, что я пропустил?Как увеличить OCR-выход tesstwo с использованием пользовательских данных в ANDROID?

Ниже приведена часть кода, который я инициализирую tessbaseApi и устанавливаю команды.

TessBaseAPI baseApi = new TessBaseAPI(); 
    baseApi.setDebug(true); 

    baseApi.init(Environment.getExternalStorageDirectory() + "/EMB/dataBase/", "eng"); 

    baseApi.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED); 
    baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD); 
    baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE); 


    baseApi.ReadConfigFile("/path/to/configs/bazaar");  

    baseApi.setImage(myBitmap); 
    //variable for recognizing 

    String recognizedText = baseApi.getUTF8Text(); 
    /*recognizedText = recognizedText.replaceAll(blackList, "");//remove space*/ 
    String resultTxt = recognizedText; 
    // 
    baseApi.end(); 
    ocrreadytext.setText(resultTxt); 

Заранее благодарен!

+0

Я использовал baseApi.ReadConfigFile (Environment.getExternalStorageDirectory() + "/ EMB/dataBase/tessdata /" + "bazaar.txt"); Теперь приложение видит файл конфигурации, но ничего не происходит. Если я установил неизвестную команду в файле bazaar, тогда приложение выйдет из строя ... Один шаг за раз – Farmaker

ответ

Смежные вопросы