Я не хочу использовать объекты Interop, поскольку Excel не установлен на моем компьютере. Если для Interop существует отдельная dll, то ее ОК.Преобразование файла Word (doc/docx) в html-текст
ответ
Необходимо OpenXml PowerTools. Here is the documentation.
И here is the doc/video как вы используете конвертер Html.
К сожалению, это работает только для DOCX.
DOC - это другой формат, и инструменты OpenXML не будут работать на нем.
Большое спасибо за вашу помощь. Я пробовал использовать этот инструмент для работы с OpenXML и его работу. Мне также нужно работать с файлом .doc. Поэтому, если у вас есть решение для .doc-файла, чем ответьте. – Surendra
Вы можете использовать DocX, он имеет приятный api, и вам не нужно использовать interop libs.
Это бесплатная библиотека? Если вы можете предоставить пример кода, это будет большой помощью. – Surendra
Я рекомендую вам ознакомиться с их примерами, вот что: http://cathalscorner.blogspot.co.il/2010/12/replace-text-across-many-documents-in.html –
У меня не было никакого кода Получить HTML из файла слова в это. Я также искал варианты. Но у вас нет решения конвертировать документ в HTML. – Surendra
Если это файл OOXML (docx), вы можете использовать SDK OOXML, чтобы получить необработанный XML-документ и собрать вместе с ним контент. Для файлов pre-2007 * .doc вы застреваете, поскольку они находятся в собственном двоичном формате. – Dai
см. Обсуждение здесь - http://stackoverflow.com/questions/161791/word-97-2003-document-to-html-conversion-programatically –