У меня есть огромные технические pdf-книги, и я хотел бы разбить их таким образом, чтобы помочь мне находить и читать именно те части, которые я хочу из каждой книги. Я говорю об индексированных pdf-файлах с содержимым (части и главы). Я придумал следующую схему расщепления, основанную на содержании pdf:Чтение содержимого pdf pdf и разбиение файла PDF соответственно
1. Прочитайте содержание книги. 2. Создайте корневую папку для всей книги 3. Создайте одну подпапку для каждой части книги 4. Разделите книгу в одном файле pdf на главу и поместите pdf-файлы (главы) в соответствующую подпапку (часть) ,
Как это можно сделать с использованием библиотеки PDF на языке Java или Python?
Написав некоторый код. :) Вы также можете искать библиотеки, которые уже разбирают PDF-файлы и электронные книги. –
Ну, это совершенно очевидно :) Моя главная проблема - найти библиотеку, которая извлекает метаданные pdf, точно содержание содержащейся в ней книги! – Christos14
Я это знаю. Вот почему я попросил ** библиотеку ** использовать, а не для кода. Если есть подходящая библиотека, ** я ** буду использовать ее для самостоятельного кодирования **. – Christos14