2016-11-29 3 views
2

Попробуйте преобразовать файлы MS Word в HTML с помощью Python на AWS Lambda. Для .docx я знаю, что есть библиотека под названием python-docx. Но когда дело доходит до .doc, я все еще не могу найти элегантное и простое решение, потому что большинство возможных решений используют LibreOffice или OpenOffice.Преобразование файла MS Word (.doc и .docx) в HTML с использованием Python на AWS Lambda

Есть ли способ сделать переносимую версию LibreOffice/OpenOffice, которой можно управлять с помощью скриптов Python на AWS Lambda? Или, есть ли библиотека Python для файла .doc, которую я опускаю?

+0

Вы нашли решение? если да, пожалуйста, поделитесь своим опытом. Я также хочу использовать некоторые функции LibreOffice/OpenOffice в Lambda. В основном я хочу преобразовать файл .doc в .pdf. –

ответ

1

К сожалению, на данный момент, похоже, нет изящных решений для решения этой проблемы. Я попытался сделать переносную версию LibreOffice/OpenOffice, но самой большой проблемой является размер, превышающий лимит AWS Lambda.

Возможно, вы хотите дать Pandoc Попробуйте, хотя он не может обрабатывать файл .doc. Но я успешно использую его на AWS Lambda. Вы можете посетить here, чтобы узнать, как сделать переносную версию для AWS Lambda.

Смежные вопросы