Я понимаю, что можно легко разделить многостраничный PDF-файл на страницы. например, с использованием pdftk
.Как разделить PDF-страницу на разделы
Но в этом случае возьмите, например, на странице pdf статьи газеты, где одна страница может содержать несколько разных статей/рассказов. Удивление, если мы сможем разделить эту одну страницу PDF на различные разделы, не получив при этом использования GIMP
и рассматривая ее как изображение (так что текст по-прежнему доступен для поиска).