2014-10-30 2 views
-2

Я пробовал читать из файла PDF и отображать его на консоли, но он отображает некоторые странные персонажи, которые не уверены, что это такое. Мне нужно прочитать из файла PDF и отобразить его на консоли. вот мой кодЧтение из PDF и отображение на консоли

public class JavaApplication14 { 
    public static void main(String[] args) throws FileNotFoundException, IOException { 
     FileReader fr = new FileReader("F:\\abc.pdf"); 
     char[] temp = new char[10000]; 
     fr.read(temp); 

     System.out.println(temp); 

    } 

} 
+0

Какой должен быть выход вашей программы? – Jens

+1

Из документации: 'FileReader предназначен для чтения потоков символов. Файлы Pdf являются двоичными, поэтому вы не можете их читать. – Eypros

+0

Когда вы открываете видеофайл таким образом, вы ожидаете, что субтитры появятся в качестве аргумента для println()? –

ответ

1

Вам необходимо использовать библиотеку для правильного чтения PDF-документов. iText и PDFBox являются примерами.

Странный вывод, потому что содержание является бинарным: он также содержит шрифты, изображения, цвет, метаданные ...

+0

в PDFBox, найдите PDFTextStripper. https://pdfbox.apache.org/cookbook/textextraction.html –

-1

Вам понадобится itextpdf Lib для этого примера. Просто загрузите его и поместите в папку lib вашего проекта.

public class GetPDFContent { 

    public static String reader(String filename) throws IOException { 
     PdfReader reader = new PdfReader(filename); 

     pageNum = reader.getNumberOfPages(); 
     for (int i=1; i< pageNum; i++) { 
      String page = PdfTextExtractor.getTextFromPage(reader, i); 
      System.out.println(page); 
     }  
    } 
} 
Смежные вопросы