Я хотел бы узнать, как извлечь из этого PDF (Исх. Изображение) http://postimg.org/image/ypebht5dx/Java PDFBox, извлекать данные из столбца таблицы
Например, я хочу, чтобы извлечь только значения в столбец «TENSIONE [V]», и если он встречает пустую ячейку, я ввожу букву «X» на выходе. Как я мог это сделать?
Код я использовал это:
PDDocument p=PDDocument.load(new File("a.pdf"));
PDFTextStripper t=new PDFTextStripper();
System.out.println(t.getText(p));
и я получаю этот выход:
http://s23.postimg.org/wbhcrw03v/Immagine.png
Изображение, которое вы показываете, является тестовым выходом, заданным 'System.out.println (t.getText (p));'? – Smit
Нет, он извлекается только текст! – Enzo
Ну, как вы уже извлекли текст, вы можете выполнить некоторую операцию String и получить нужные вам части. Вы можете использовать [PDFTextStripper API] (http://pdfbox.apache.org/apidocs/org/apache/pdfbox/util/PDFTextStripper.html). Он имеет getLineSeperateor – Smit