Я должен создать PDF с возможностью поиска с нескольких изображений с 24-разрядной глубиной jpg. Я использую tess-two, который по умолчанию поставляется с libpng. Проблема в том, что tesseracts выводит поврежденный pdf! Изображений нет в pdf. Текст по-прежнему присутствует в pdf.Tesseract pdf renderer с 24-разрядной глубиной jpg image
У меня нет проблем при использовании png-файлов, однако входной файл jpg. Преобразование JPG, чтобы детские с помощью следующего кода очень много времени:
BitmapFactory.Options options = new BitmapFactory.Options();
options.inPreferredConfig = Bitmap.Config.ARGB_8888;
Bitmap bitmap = BitmapFactory.decodeFile("myimage.jpg", options);
File file = new File("myoutputimage.png");
FileOutputStream fOut;
try
{
fOut = new FileOutputStream(file);
bitmap.compress(Bitmap.CompressFormat.PNG, 0, fOut);
fOut.flush();
fOut.close();
}
catch (Exception e)
{
e.printStackTrace();
}
На моей машине это занимает 2 секунды, чтобы создать файл в формате PNG.
Я уже скомпилировал tess-two с libjpeg, но это тоже не сработало. Можно ли создать PDF с возможностью поиска с помощью tesseract с входными файлами jpg?