2015-08-10 2 views
-1

У меня есть сценарий, в котором мне нужно искать заголовок заголовка из двух файлов MS Word doc (x), и вам нужно обновить третий (что снова является MS Word файл).Как читать содержимое из файла MS Word с помощью Perl

Чтобы создать файл MS Word, существуют CPAN-модули, но есть ли какие-либо модули CPAN для его чтения и управления соответствующим содержимым?

+0

Престола [Преобразование .docx файлов в виде простого текста и сохранения разрывы строк, чтобы сохранить ссылки на номер строки в исходном документе : howto & implications?] (http://unix.stackexchange.com/questions/145230/converting-docx-files-to-plain-text-and-preserving-line-breaks-to-maintainline) и [Как могу ли я прочитать файл .docx в perl?] (http://www.perlmonks.org/?node_id=1029093) –

+0

Я использую Linux, и я могу создать ели файл docx, но я не могу прочитать файл docx с помощью доступных модулей CPAN. – Jassi

ответ

0

С быстрым гугле я нашел следующие решения:

Using Win32 modules

Using Text::Extract::Word

+1

Примечание: 'Win32 :: OLE' не может использоваться в Linux. –

+1

Также протестирован 'Text :: Extract :: Word' на Linux, чтобы прочитать файл' .docx', но получил ошибку '' Это не похоже на документ Word, но он притворяется «одним». Может быть, этот модуль не может прочитать '.docx'? –

+0

@ HåkonHægland согласился с вашими комментариями (y) – Jassi