Я использую Tess-two для документов OCR. Кажется, что команда Tesseract проделала отличную работу, и результаты очень хорошие!
Но теперь я хочу использовать только слова из файла user_data.
Здесь https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#config-files-and-augmenting-with-user-data - очень хороший пример. Я нашел каждый файл в моем проекте Android, который предлагает ссылка Tesseract, но я не могу заставить программу использовать слова из файла user_data. Я нашел файл .bazaar в папке configs, но как я установил это в своем коде?
Есть ли что-то, что я пропустил?Как увеличить OCR-выход tesstwo с использованием пользовательских данных в ANDROID?
Ниже приведена часть кода, который я инициализирую tessbaseApi и устанавливаю команды.
TessBaseAPI baseApi = new TessBaseAPI();
baseApi.setDebug(true);
baseApi.init(Environment.getExternalStorageDirectory() + "/EMB/dataBase/", "eng");
baseApi.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED);
baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD);
baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE);
baseApi.ReadConfigFile("/path/to/configs/bazaar");
baseApi.setImage(myBitmap);
//variable for recognizing
String recognizedText = baseApi.getUTF8Text();
/*recognizedText = recognizedText.replaceAll(blackList, "");//remove space*/
String resultTxt = recognizedText;
//
baseApi.end();
ocrreadytext.setText(resultTxt);
Заранее благодарен!
Я использовал baseApi.ReadConfigFile (Environment.getExternalStorageDirectory() + "/ EMB/dataBase/tessdata /" + "bazaar.txt"); Теперь приложение видит файл конфигурации, но ничего не происходит. Если я установил неизвестную команду в файле bazaar, тогда приложение выйдет из строя ... Один шаг за раз – Farmaker