Я хочу извлечь содержимое файла MS Office с помощью C#. Например: я хочу открыть doc/docx/xls/xlsx/ppt/pptx и иметь возможность извлекать текст и информацию вроде (количество страниц - слово, количество листов - excel, количество слайдов - ppt, число графиков - excel, количество изображений - powerpoint и т. д. и т. д. и т. д.). Я понял, что могу извлечь текст, используя Windows iFilter. Но это только дает мне текст. Кто-нибудь знает DLL или что-то, что может дать мне такую информацию? Если нет, есть ли сайт, который подробно объясняет скелет офисного xml-файла?Извлечение свойств MS Office
-1
A
ответ
1
Для DOCX/XLSX/PPTX предложений MS бесплатную библиотеку под названием OpenXML SDK, которую вы можете использовать для достижения того, что вы просили ...
Для DOC/XLS/PPT (старше/двоичный) Я не знаю, свободной библиотеки - есть некоторые коммерческие библиотеки, которые поддерживают это:
- Aspose.Words (DOC и DOCX)
- Aspose.Cells (XLS и XLSX)
- Flexcel (XLS и XLSX)
- SpreadSheetGear (XLS и XLSX)
- Aspose.Slides (РРТ и PPTX)
- Spire.Office (DOC и DOCX и XLSX XLS и)
Коммерческого библиотеки обычно предлагают очень богатый набор функций - например, экспорт в PDF ...
1
формат XML Офис объясняется здесь:
http://msdn.microsoft.com/en-us/library/aa338205(v=office.12).aspx
Это стоит прочитать статью в Википедии, чтобы сориентировать себя перед погружением в
Смежные вопросы
- 1. MS Office Javascript API
- 2. MS Office Добавить
- 3. дешифрование MS office
- 4. Обновление MS Office
- 5. Преобразование MS Office XML
- 6. MS Office Webservice toolkit для Office 2007?
- 7. Возможно создание эскизов файлов MS Office?
- 8. Закрыть Консоль MS Office C#
- 9. Установка MS Office на сервере
- 10. Загрузитель в MS Office Надстройка
- 11. Как разбирать документы ms-office
- 12. Изменить значок кнопки MS Office
- 13. Переопределение горячих клавиш MS Office
- 14. Paypal пожертвовать в MS Office
- 15. Аутентификация URL-адреса MS Office
- 16. Получить MS Office ApplicationID программным
- 17. Сброс местоположения надстройки MS Office
- 18. MS Office Mobile Digital Signature
- 19. Я проверяю версию Ms Office
- 20. Дата последнего обновления MS Office?
- 21. MS Office PIAs «обратная совместимость»
- 22. Плагин MS Office Firefox (NPAPI)
- 23. Попытка прочитать документ MS Office
- 24. Извлечение вложений из Office 365
- 25. Извлечение свойств из массива
- 26. извлечение свойств объекта Wix
- 27. Извлечение свойств из DbSqlQuery
- 28. Использование MS Office Interop v11 с Office 2010
- 29. Ошибки Office Office
- 30. SDK для MS OFFICE 2010 Excel
это, возможно, является хорошим выбором. Вероятно, я мог бы программно изменить документ на docx, а затем вызвать OpenXML SDK. – nunoaac