попробовать это,
' Path of input PDF document
Dim filePath As String = "d:\\Source.pdf"
' Instantiate the Document object
Dim document As Aspose.Pdf.Document = New Aspose.Pdf.Document(filePath)
' Create DocSaveOptions object
Dim saveOptions As DocSaveOptions = New DocSaveOptions()
' Set the recognition mode as Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow
' Set the Horizontal proximity as 2.5
saveOptions.RelativeHorizontalProximity = 2.5F
' Enable the value to recognize bullets during conversion process
saveOptions.RecognizeBullets = True
' save the resultnat DOC file
document.Save("d:\\Resultant.doc", saveOptions)
Если вы не понимаете как PDF файл-формат & файл-формат Word, почему бы это было легко? Вам понадобятся библиотеки для чтения и записи этих форматов. Вы изучили, как это сделать? Вы можете получить простой текст со многими ограничениями, но вы не получите много форматирования. –
Да, я знал, что для чтения PDF-файлов нужна одна библиотека, а другая - для написания ms-файлов. Но я не могу найти, как мне обнаружить изображения во время чтения PDF-файла и извлечь его. Однако для этого должна существовать библиотека. – Gentuzos
Возможно, iTextSharp - но я использовал оригинальный Java iText, и это непросто. http://stackoverflow.com/questions/83152/reading-pdf-documents-in-net –