2010-07-05 3 views
8

Я ищу анализатор на базе python на базе Microsoft - в частности, PowerPoint.Microsoft Powerpoint Python Parser

Я хочу иметь возможность анализировать PPT в python и извлекать из файла PowerPoint такие вещи, как текст и изображения.

Имеется ли библиотека?

ответ

5

Я не думаю, что есть такая библиотека.

Что вы можете сделать, это использовать пакет pywin32 для доступа к COM-терминалу PowerPoint.

Вот очень хорошее введение в использовании модуля win32com для автоматизации задач в PowerPoint кто-то написал: http://www.s-anand.net/blog/automating-powerpoint-with-python/

+0

Спасибо! Я нахожусь сейчас. Ссылка была очень полезной для понимания того, как идти по всему процессу. – ramaz

3

Возможно, вы найдете такого зверя, но я бы поставил против него; вы ищете два редких свойства вместе.

Возможно, вы можете использовать SDK Open Office, который уже имеет огромное количество машин для считывания файлов Power Point и злоупотребляет им для ваших целей. Это все Java, а не Python, но я предполагаю, что кривая обучения для изучения Java намного меньше, чем кривая обучения, чтобы выяснить, как читать файлы PowerPoint.