2016-03-24 3 views
1

Ищите бесплатную/платную библиотеку .net для извлечения элементов текста/изображения/изображения данного документа Acrobat (.pdf) предпочтительно в качестве объектной модели, чтобы мы могли перевести его в другой формат это понятно для частного редактора WYSIWYG.Извлечение элементов Pdf с использованием .net

Если прямой перевод невозможен, можно увидеть, какие возможные подходы могут быть предприняты для захвата текстовых элементов, фигур/графики, изображений отдельно. Формат цели требует, чтобы элементы были явно размещены с использованием позиций x, y на странице, и было бы необходимо, чтобы библиотека извлечения PDF сообщила мне координаты проанализированных элементов внутри страницы.

Любые предложения были бы очень признательны.

+1

Вопросы, предлагающие нам рекомендовать или находить книгу, инструмент, библиотеку программного обеспечения, учебное пособие или другой ресурс вне сайта, не относятся к теме для переполнения стека, поскольку они, как правило, привлекают упрямые ответы и спам. Вместо этого опишите проблему и то, что было сделано до сих пор, чтобы ее решить. –

ответ

1

Для выполнения этой задачи вы можете использовать Docotic.Pdf library.

Библиотека может extract text и предоставлять информацию о координатах каждого слова или даже символа. И это может быть extract images from PDF documents, предоставляя информацию о позиции изображения, размере и преобразованиях.

Отказ от ответственности: Я работаю для поставщика библиотеки.

Смежные вопросы