2013-08-02 3 views
-1

Я пытаюсь разработать программу, которая позволяет пользователю преобразовать файл pdf в текстовый файл с помощью vb.net.Как преобразовать PDF-файл в текстовый файл с помощью vb.net

Есть ли хороший API для этого?

И, как легко, как это выглядит?

+0

Если вы не понимаете как PDF файл-формат & файл-формат Word, почему бы это было легко? Вам понадобятся библиотеки для чтения и записи этих форматов. Вы изучили, как это сделать? Вы можете получить простой текст со многими ограничениями, но вы не получите много форматирования. –

+0

Да, я знал, что для чтения PDF-файлов нужна одна библиотека, а другая - для написания ms-файлов. Но я не могу найти, как мне обнаружить изображения во время чтения PDF-файла и извлечь его. Однако для этого должна существовать библиотека. – Gentuzos

+0

Возможно, iTextSharp - но я использовал оригинальный Java iText, и это непросто. http://stackoverflow.com/questions/83152/reading-pdf-documents-in-net –

ответ

0

попробовать это,

' Path of input PDF document 
Dim filePath As String = "d:\\Source.pdf" 
' Instantiate the Document object 
Dim document As Aspose.Pdf.Document = New Aspose.Pdf.Document(filePath) 
' Create DocSaveOptions object 
Dim saveOptions As DocSaveOptions = New DocSaveOptions() 
' Set the recognition mode as Flow 
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow 
' Set the Horizontal proximity as 2.5 
saveOptions.RelativeHorizontalProximity = 2.5F 
' Enable the value to recognize bullets during conversion process 
saveOptions.RecognizeBullets = True 
' save the resultnat DOC file 
document.Save("d:\\Resultant.doc", saveOptions) 
Смежные вопросы