2014-09-11 2 views
0

Я хотел извлечь информацию о стилях текстовых документов из tesseract.Those информация о стиле включает в себя информацию о заголовках, подзаголовках, текстовом стиле, как жирный, курсив и подчеркивание. Какая часть кода tesseract дает мне эту информацию?Есть ли способ извлечь информацию о стиле документов из tesseract?

ответ

0

ResultIterator класс имеет WordFontAttributes метод, который формирует информацию о шрифте.

+0

Как получить эту информацию из tesseract? Мне нужны эти логические значения для каждой строки, присутствующей в документе. –

+0

См. [APIExample] (https://code.google.com/p/tesseract-ocr/wiki/APIExample) и [пример Java] (http://sourceforge.net/p/tess4j/code/HEAD/tree/ Tess4J_3/багажник/тест/сеть/SourceForge/tess4j/TessAPITest.java). – nguyenq

Смежные вопросы