Это пример из «IText в действии» использования Прямоугольник, чтобы выбрать часть документа для извлечения текста из PDF-файла:Использование Прямоугольник для выделения текста в IText
PdfReader reader = new PdfReader(pdf);
PrintWriter out = new PrintWriter(new FileOutputStream(txt));
Rectangle rect = new Rectangle(70, 80, 420, 500);
RenderFilter filter = new RegionTextRenderFilter(rect);
TextExtractionStrategy strategy;
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
strategy = new FilteredTextRenderListener(
new LocationTextExtractionStrategy(), filter);
out.println(PdfTextExtractor.getTextFromPage(reader, i, strategy));
}
out.flush();
out.close();
То, что я не понимаю это значение этих чисел (70, 80, 420, 500). Обычно (70, 80) - координата, 420 - ширина, 500 - высота прямоугольника, но я не уверен в масштабе, как он измеряется, а также точную точку начала. Может ли кто-нибудь объяснить это мне или показать примерный пример?
PDF определяет систему координат для каждой страницы, посредника, которую вы можете запросить у PdfReader. Очень распространено происхождение, расположенное в левом нижнем углу, а единица - 1/72 дюйма. – mkl