Я интегрировал Tesseract-ocr в Alfresco 5.0.d, Мое требование - преобразовать данные PDF-файла в текстовый формат.Tesseract-ocr не работает должным образом после интеграции с alfresco 5.0.d
И его работая отлично для малых размеров файлов.
Но если я буду загружать большие файлы размером, скажем, более чем 50 MB,
В этом случае его отдача ниже Exception, и весь файл PDF не преобразуются в текстовый файл. Только некоторые исходные страницы преобразуются в текстовый формат.
Пожалуйста сошлитесь внизу журналы
java.net.SocketTimeoutException: Read timed out
at java.net.SocketInputStream.socketRead0(Native Method)
at java.net.SocketInputStream.socketRead(SocketInputStream.java:116)
at java.net.SocketInputStream.read(SocketInputStream.java:170)
at java.net.SocketInputStream.read(SocketInputStream.java:141)
at sun.security.ssl.InputRecord.readFully(InputRecord.java:465)
at sun.security.ssl.InputRecord.read(InputRecord.java:503)
Кто-нибудь сталкивались с такой же вопрос, пожалуйста, помогите мне.
Заранее спасибо.
Может кто-нибудь, пожалуйста, помогите мне решить эту проблему, это действительно на высоком приоритете –