2009-07-28 3 views
0

Есть ли пример кода или утилиты, которые я мог бы использовать для чтения документов PDF и преобразования или экспорта данных в документ Excel?Извлечь данные из PDF и импортировать в Excel .NET

Большинство примеров кода, которые я вижу при поиске, преобразуют Excel в PDF.

+0

Я нашел некоторую полезность из pdfbox, где я использую DLL для извлечения текста из файла pdf. – Batuta

ответ

1

Проблема в том, что PDF, вероятно, не сохраняет структуру типа электронных таблиц - ее просто текст, нарисованный на странице. Таким образом, вы вряд ли будете довольны результатами, если это не очень простая страница.

0

Ваш единственный реальный вариант - искать стороннее решение. Я сомневаюсь, что вы найдете бесплатный SDK, который позволит вам это сделать по той простой причине, что это не так просто. Я проверил бы Solid Documents и, возможно, некоторые из Investintech's solutions.

Более свежие версии Acrobat также предоставляют несколько дополнительных возможностей для извлечения PDF в Excel, поэтому Adobe's PDF Library SDK тоже стоит посмотреть.

1

Вы можете вытащить данные с помощью pdfsharp и использовать openxml sdk для создания файла excel. Таким образом вы получите именно то, что хотите. Это займет немного работы, но не требует excel или acrobat или чего-либо, что стоит денег.

Плюсы:

  • Free
  • объектная модель
  • Нет Excel
  • только использует библиотеки
  • Вы получаете именно то, что вы хотите

Минусы:

  • Занимает время, чтобы закодировать его
1

Я создал решение, которое использует комбинацию XPDF с открытым исходным кодом и VBA для импорта данных из нескольких PDF-файлов в Excel в структурированном формате. Он работает, задавая начальные и конечные текстовые шаблоны и извлекая текст между ними с помощью дополнительных заметок для очистки вывода. Решение можно скачать бесплатно с http://www.business-spreadsheets.com/forum.asp?t=884

Смежные вопросы