Мне нужно извлечь табличные объекты из PDF-документов, желательно программно используя Perl. Я могу вырезать и вставлять в Excel, но таблица потребует довольно небольшого ручного редактирования после импорта данных в Excel.Могу ли я извлечь таблицы из PDF с помощью Perl?
Я сделал поиск, но пока кажется, что большинство форумов показывают, что большинство API-интерфейсов очень примитивны.
Я только что провел полдня, пытаясь сделать именно это. Я пришел к выводу, что быстрее скопировать и вставить в Excel, чем пытаться программно получить данные из PDF. – CanSpice
Вы посмотрели на CPAN? Там есть несколько высоко оцененных API. Существуют также некоторые несвободные опции, такие как PDFlib, которые можно использовать с Perl и работать очень хорошо. – Cfreak
@ Cfreak, да, я посмотрел на CPAN; как упоминалось выше, не похоже, что эти модули могут читать объекты в PDF. Если я ошибаюсь, мне бы хотелось, чтобы кто-то указал правильный модуль и как его использовать для чтения таблицы. – Face