2013-11-01 2 views
0

У меня есть следующий код:Tess4j результата итератор

public String getName(BufferedImage subc){ 
     String name=null; 
     Tesseract1 instance = new Tesseract1(); 
     instance.setPageSegMode(8); 
     instance.setLanguage("eng"); 
     instance.setTessVariable("tessedit_char_whitelist", "qwertyuiopasdfghjklzxcvbnmQWERTYUIOPASDFGHJKLZXCVBNM_."); 
     try {   
      name=instance.doOCR(subc); 
     } catch (TesseractException e) {System.err.println(e.getMessage());} 
     name=new StringTokenizer(name,"\n").nextToken(); 
     return name; 
} 

где SUBC этого изображение уже вырезать и препроцессор слова. То, что я хочу, это либо получить уверенность в распознавании изображения, либо повторить первое, скажем, 30 наиболее вероятных слов. Я нашел примеры, как этот Tess4J: How to get a Character's confidence value?, но он ломает на первой линии,

TessResultIterator ri = TessAPI1.TessBaseAPIGetIterator(api); 

, когда я кладу объект «экземпляр» в качестве параметра «API», и после того, как некоторые пытаются использовать getpointer и различные объекты, я ве до сих пор не повезло. Здесь http://tess4j.sourceforge.net/docs/docs-1.0/net/sourceforge/tess4j/package-summary.html, в сводке классов я понимаю, что, возможно, объекты Tesseract или Tesseract1 не являются наиболее подходящими для того, что я хочу сделать, но мне не удалось распознать слово из изображения с помощью TessAPI или TessAPI1. ResultIterator в C++ выглядит довольно кратким, но с указателями: https://code.google.com/p/tesseract-ocr/wiki/APIExample Спасибо!

ответ

2

Tesseract является упрощенным API, предоставляющим только наиболее часто используемые методы из интерфейса TessAPI. Чтобы получить уверенность в тексте, вам нужно будет работать с TessAPI. Библиотека unit tests включает некоторые распространенные варианты использования. Вы определенно хотите взглянуть на них.

Смежные вопросы