2014-10-29 8 views
0

Я не хочу использовать объекты Interop, поскольку Excel не установлен на моем компьютере. Если для Interop существует отдельная dll, то ее ОК.Преобразование файла Word (doc/docx) в html-текст

+0

Если это файл OOXML (docx), вы можете использовать SDK OOXML, чтобы получить необработанный XML-документ и собрать вместе с ним контент. Для файлов pre-2007 * .doc вы застреваете, поскольку они находятся в собственном двоичном формате. – Dai

+0

см. Обсуждение здесь - http://stackoverflow.com/questions/161791/word-97-2003-document-to-html-conversion-programatically –

ответ

0

Необходимо OpenXml PowerTools. Here is the documentation.

И here is the doc/video как вы используете конвертер Html.

К сожалению, это работает только для DOCX.
DOC - это другой формат, и инструменты OpenXML не будут работать на нем.

+0

Большое спасибо за вашу помощь. Я пробовал использовать этот инструмент для работы с OpenXML и его работу. Мне также нужно работать с файлом .doc. Поэтому, если у вас есть решение для .doc-файла, чем ответьте. – Surendra

1

Вы можете использовать DocX, он имеет приятный api, и вам не нужно использовать interop libs.

+0

Это бесплатная библиотека? Если вы можете предоставить пример кода, это будет большой помощью. – Surendra

+0

Я рекомендую вам ознакомиться с их примерами, вот что: http://cathalscorner.blogspot.co.il/2010/12/replace-text-across-many-documents-in.html –

+0

У меня не было никакого кода Получить HTML из файла слова в это. Я также искал варианты. Но у вас нет решения конвертировать документ в HTML. – Surendra