2010-01-18 4 views
2

Кто-нибудь знает о хорошем решении для конвертации PDF-файлов в слова .doc-файлы (а не docx) программно? Я пробовал решение SautinSoft, но даже несмотря на то, что он выполняет эту работу, это не лучшее качество.C# - pdf to word программно

+0

Duplicate: http://stackoverflow.com/questions/2192400/does-anyone-know-of-a-way-to-easily-convert-a-pdf-to-a-docx-format-programmatical –

ответ

1

Мы предлагаем решение под названием EasyConverter SDK, которые вы можете дать попробовать:

http://www.pdfonline.com/easyconverter/sdk/index.htm

Если вы хотите получить быстрое представление о том, как будут выглядеть результаты, прежде чем пытаться оценить версию, вы можете использовать онлайн-конвертер здесь:

http://www.pdfonline.com/pdf2word/index.asp

Существует множество соображений при преобразовании в основном статического формата, такого как PDF в Word. EasyConverter SDK прекрасно работает для большинства бизнес-документов, в то время как маркетинговые документы (которые обычно используют более привлекательные макеты) обычно более сложны.

+0

спасибо , это полезно для меня. – Uday

2

Как и в «решении», таким образом, чтобы сделать это, возможно, но вы должны были бы DIGG в этом сами:

Формат PDF файл ... довольно трудно понять. Прежде всего, его нельзя сравнивать с форматом Word вообще. Формат предназначен для последовательного просмотра на всех платформах и принтерах, Word в нем, немного менее строгий.

Редактирование файлов PDF, во-первых, тоже довольно сложно: потому что у вас нет «текста», как в Word; это больше похоже на куски писем. Все они расположены индивидуально.

Единственное выполнимо решение, которое я вижу следующее:

  1. Отрендерьте PDF к изображению. (Для этого требуется библиотека для рендеринга PDF!)
  2. Добавить это изображение в файл .doc. (Таким образом, требуется библиотека для записи .DOC!)

Я думаю, что это то, что делает SautinSoft; это причина его плохого качества. Изображения могут стать довольно большими, если вы хотите хорошего качества (т. Е. Вы не можете получить оптимизацию, например, общие шрифты или повторяющуюся графику, например, у вас есть файлы PDF).

0

PDF - это формат отображения «endfile», поэтому он отбрасывает много деталей, которые вам понадобятся в текстовом файле (например, потоке). Есть инструменты, но вы вряд ли будете полностью довольны результатами.

Существует сообщение в блоге объяснить вопросы лучше http://pdf.jpedal.org/java-pdf-blog/bid/12670/PDF-text

1

Преобразование PDF в SVG и встраивание SVG в документ Word.