2013-10-24 4 views
0

Как получить номер страницы, содержащий определенное слово в pdf в pdfbox API в java?введите номер страницы, который содержит определенное слово в pdf

Я могу прочитать слово:

PDFTextStripper s = new PDFTextStripper(); 
String contents = s.getText(pdoc); 
if(contents.contains("SUBSCRIPTION DETAILS")){ 
... 
} 

Но не смог найти номер страницы, которая содержит это слово

Спасибо заранее.

ответ

1

PDFTextStripper позволяет вам читать точную страницу. Таким образом, вам необходимо пройти через все страницы и проверить, содержит ли определенная строка:

PDDocument pdoc = ...; 
for(int pageNumber = 1; pageNumber < pdoc.getPageCount(); i++){ 

    PDFTextStripper s = new PDFTextStripper(); 
    s.setStartPage(pageNumber); 
    s.setEndPage(pageNumber); 
    String pageText = reader.getText(pdoc); 
    String contents = s.getText(pdoc); 
    if(contents.contains("SUBSCRIPTION DETAILS")){ 
    ... 
    } 
} 
+0

Благодарим за отзыв. Но я хочу номер страницы, который содержит этот текст. Пожалуйста, дайте мне знать, если мой вопрос ясен вам. – user2914640

+0

Вам нужно пройти через страницы и проверить каждую страницу. См. Код. – user987339

+0

Спасибо большое. Теперь работает. – user2914640

Смежные вопросы