2010-11-07 2 views
0

приветпарсинг PDF, чтобы преуспеть с #

У меня есть файл в формате PDF содержит таблицу, например, для работника (EmpId, EmpName, Title) я хочу, чтобы разобрать этот PDF-файл, чтобы преуспеть и разбор этой таблицы в Excel для DataTable в моем код

быстрый ответ высоко ценится

Thnx

+3

Прекратите запрашивать быстрые ответы от совершенно незнакомых людей. Тот факт, что что-то срочно для вас, не делает этого для нас. – Oded

+0

Я попытался разобрать pdf, используя abcpdf.net, и он дает мне преобразование pdf в текстовый файл, но неструктурирован, потому что мой файл pdf содержит несколько таблиц, тогда я подумал о преобразовании pdf в файл excel, а затем о том, файл в моем коде – hatem

+0

Можете ли вы опубликовать пример PDF, который вы пытаетесь извлечь, и тогда мы сможем дать вам дополнительные подсказки? –

ответ

1

Если файл был создан с структурированным содержанием в нем, то это может быть возможным, чтобы извлечь все данные в виде файла XML, а затем импортировать XML в Excel.

В противном случае вы в значительной степени оставили кучу текстовых блоков, и, вероятно, вы ничего не можете с этим поделать.

Для получения дополнительной информации проверьте отличную статью о PDF Text в блоге JPedal.

+0

к сожалению, это неструктурированный pdf, и я не могу преобразовать его в xml – hatem

Смежные вопросы