Привет, У меня есть файл PDF, и мне нужно найти в нем определенную строку. Я пробовал различные методы, и я могу прочитать все содержимое в файле PDF, но не смог найти определенную строку.Чтобы найти конкретный файл в PDF-документе, используя Java
Вот в этом файле, мне нужно искать строку, такие как телефон, Garbage, аренда и т.д. индивидуально.
Не могли бы Вы помочь мне?
У меня есть нижеследующий код для чтения файла.
public class PDFBoxReader {
private PDFParser parser;
private PDFTextStripper pdfStripper;
private PDDocument pdDoc ;
private COSDocument cosDoc ;
private String Text ;
private String filePath;
private File file;
public PDFBoxReader() {
}
public String ToText() throws IOException
{
this.pdfStripper = null;
this.pdDoc = null;
this.cosDoc = null;
file = new File("D:\\report.pdf");
parser = new PDFParser(new FileInputStream(file));
parser.parse();
cosDoc = parser.getDocument();
pdfStripper = new PDFTextStripper();
pdDoc = new PDDocument(cosDoc);
pdDoc.getNumberOfPages();
pdfStripper.setStartPage(1);
pdfStripper.setEndPage(10);
// reading text from page 1 to 10
// if you want to get text from full pdf file use this code
// pdfStripper.setEndPage(pdDoc.getNumberOfPages());
Text = pdfStripper.getText(pdDoc);
return Text;
}
public void setFilePath(String filePath) {
this.filePath = filePath;
}
}
Было бы здорово, если бы кто-то помог мне с кодом, который ищет определенную строку. Заранее спасибо.
Я действительно не понимаю. Теперь у вас есть строка, содержащая весь контент из диапазона страниц или даже одной страницы. Что мешает вам искать эту строку для вашей конкретной строки? – mkl
Если бы вы могли видеть PDF, мне нужно получить столбец рядом с этой конкретной строкой. Скажите по телефону, мне нужно получить следующий столбец с значением 0. Это относится ко всей такой строке. – SRS
Итак, вы хотите извлечь структурированные данные из PDF. Это обычно сложно. Куда вы делитесь своим примером документа как PDF, а не как изображение? – mkl