2009-11-12 3 views
5

Ищете разработку серверного приложения, которое будет обрабатывать документы. Исходными документами являются в основном MS-Word 2003, 2007, то есть версия MS Docx. Хотите, чтобы серверное приложение могло работать как в Linux, так и в Windows. Хотите узнать, что является лучшим инструментом или библиотекой для чтения и записи файлов MS-Word под Linux. Совместимость - самое важное соображение. Необходимо сохранить форматирование исходного документа, включая таблицы.Создание и редактирование документов MS-Word на сервере linux?

Я видел подобный пост here, но он был специфичен для python. Мне все равно, какой язык или библиотеки используются, если они доступны для окон и Linux.
Не обязательно требует MS-Word для чтения файлов Word.
Мне известно о Open Office, но я ищу решение, которое имеет высокую степень совместимости с файлами MS-Word. Также натолкнулось на это решение, которое выглядит многообещающим. aspose.com У кого-нибудь был опыт использования Aspose.Words для Java или подобных пакетов сторонних разработчиков? Это выглядит многообещающим, но это дорого стоит более $ 2K для подписки OEM. Тем не менее, если он поставляет рекламу, он все равно может быть лучшим решением.

спасибо Было несколько предложений, но ничего до сих пор не соответствовало бы счету (или бюджету).

+0

Что именно вы подразумеваете под «процессом»? –

+0

Добавить теги, переформатировать в другой стиль шаблона, экспортировать в другие форматы. Разрешить пользователям вводить слово doc, импортировать документ, сканировать документ для ключевых слов, которые хранятся в базе данных сервера. Для того, чтобы работать в Intranet клиента – 10ToedSloth

ответ

5

Вы рассматривали использование b2xtranslator для преобразования двоичного .doc в .docx. (В Linux вам придется запускать его в Mono)

Затем вы можете использовать POI или docx4j для управления docx. Не решение, если вам нужно сохранить как .doc (если вы не используете OO для этого бита)

+0

b2xtranslator зависит от класса system.io.packaging .net, который mono только недавно поддерживал, и я думаю, что все еще немного шелушатся. –

+2

@CharlesStewart Я портировал его на .NET Core (https://github.com/EvolutionJobs/b2xtranslator), что должно помочь в этом. – Keith

0

Хорошо, я еще раз попытать в ответ ;-)

Что об использовании unaconv

Она может конвертировать любой документ OpenOffice может читать любой документ OpenOffice может писать. Вы должны иметь возможность использовать это для преобразования как в/из документов MS-Word (при условии, что они не слишком сложны, и я обнаружил, что открытый офис не может справиться очень хорошо).

Единственное предостережение в том, что для взаимодействия с unoconv вам необходимо иметь экземпляр OpenOffice, работающий на сервере linux.

+0

еще раз, я знал, что OO может быть одним из решений. Хотя я регулярно использую OO 3, у него есть те же проблемы, что и для старых двоичных файлов Word, например Word 97-2003. Посмотрите, есть ли доступные совместимые решения. Cheers – 10ToedSloth

-1

Моно недавно получил поддержку класса system.io.packaging .net, который позволяет в некоторой степени манипулировать файлами docx , Если вы хотите, чтобы вы добавляли/удаляли ресурсы и повторяли текст, это, вероятно, правильно.

Смежные вопросы