2009-06-15 4 views
2

У меня есть файл с удобным PDF-файлом, в котором есть куча полей, которые будут заполняться пользователями. Оттуда я хочу обработать эти файлы, извлекая введенные пользователем поля в файл CVS.Как я могу извлечь введенные пользователем поля из PDF?

Поскольку я парень .NET, я взглянул на PDFBox и iTextSharp. С PDFBox мне удалось извлечь текст формы, но не поля, которые пользователь вводит в поля. Это не кажется тривиальным, если я ошибаюсь.

Есть ли более быстрый способ завершить это на любом другом языке? Я слышал об Adobe SDK и буду исследовать это дальше, но пока я ничего не знаю об этом. Или кто-то знает, как выполнить то, что я пытаюсь сделать с вышеупомянутыми библиотеками?

ОБНОВЛЕНИЕ: Никто не знает о каких-либо открытых источниках или бесплатных библиотеках? Я делаю это более доказательство концепции и не имею нескольких hundy, чтобы справиться с проблемой.

ответ

0

Хотя я не использовал этот конкретный продукт из ASPOSE, компонент ASPOSE.Pdf.Kit будет извлекать как имена полей, так и полевые данные.

От их literature:

"Вы также можете прочитать все поля формы из PDF-документов, включая их имена и значения в XML, FDF (Form Data Format) и XFDF файлы."

0

Назад, когда я заглянул в это (несколько лет назад), вам пришлось использовать Acrobat Professional, а не Acrobat Reader, чтобы заполнить формы, которые позже могут быть прочитаны. Я никогда не понимал, почему вы не можете сделать это с помощью Acrobat Reader.

1

Я очень рекомендую Tall Components PDF продукты. Я использовал компонент TallPDF.NET для генерации PDF-файлов динамически. Tall Components PDFKit.Net, вероятно, сделает все, что вам нужно. Я не использовал этот конкретный продукт у них, но если это что-то похожее на их компонент TallPDF, то это будет отлично. Это довольно дорого, хотя ... где-то около 700 долларов за лицензию. Но у них есть оценочная загрузка для вас, чтобы попробовать.

Смежные вопросы