Я использую XSLFPowerPointExtractor для извлечения текста из файла pptx. Однако весь текст в файле pptx возвращается мне в одной строке. В любом случае, я могу получить текст на каждом слайде отдельно? Я совершенно новичок в этой концепции, поэтому, пожалуйста, дайте подробные ответы.Как извлечь данные из файла pptx с помощью Apache POI?
-3
A
ответ
0
Я просмотрел документацию по API, и кажется, что это либо все, либо ничего. У API documentation есть метод, называемый getText(), который возвращает весь текст для всех слайдов, который является именно тем поведением, которое вы наблюдаете.
Немного больше googling показал мне, что способ сделать это - использовать другой API, а именно XMLSlideShow. Это дает вам слайд-доступ к презентации.
Оттуда вы можете получить доступ к различным формам, включая текстовые области, из которых вы можете прочитать текст. На самом деле это объясняется в этом другом вопросе SO, который, я считаю, поможет вам решить вашу проблему: How to get pptx slide notes text using apache poi?
Смежные вопросы
- 1. Извлечение изображений из pptx с apache poi
- 2. Как извлечь текст из ppt, pptx-файла, кроме нижнего колонтитула, номер слайда с помощью apache poi?
- 3. Как получить исходные данные из слайдов pptx с помощью apache poi
- 4. Как извлечь текст из документа .doc с помощью apache poi?
- 5. Apache POI - Ошибка при слиянии pptx
- 6. Извлечь текст из файла PowerPoint (.ppt или .pptx)?
- 7. Извлечь XML-данные из файла gzip с помощью apache tika?
- 8. Создание таблиц в pptx с использованием Apache POI
- 9. Извлечение изображений из pptx с помощью apache poi в движке Google с помощью java
- 10. Запись файла Excel из Java с помощью apache poi
- 11. Не удается прочитать из файла Excel с помощью apache poi
- 12. Как извлечь DOCX (Word 2007 выше) с помощью Apache POI
- 13. Как извлечь обычный текст из файла DOCX с помощью новой поддержки OOXML в Apache POI 3.5?
- 14. Как извлечь все изображения из .ppt-файла с помощью Android?
- 15. Экспортировать данные, чтобы извлечь столбец листа с использованием apache poi?
- 16. примечания для слайдов с Apache POI
- 17. Как обновить XSLFTable (таблица в презентации .pptx) с помощью Apache POI?
- 18. Прочитать таблицу из файла docx с помощью Apache POI
- 19. Как изменить значение ячейки таблицы в файле pptx с помощью apache-poi 3.9?
- 20. PatternSyntaxException с помощью Apache POI
- 21. Как извлечь текст из файла PDF с помощью Apache PDFBox
- 22. Как извлечь изображения из файла с помощью Apache TIka?
- 23. Как извлечь время перехода слайда из файла PPTX
- 24. Apache POI Относительная гиперссылка файла
- 25. Как получить полное содержимое файла с помощью apache-poi?
- 26. Как изменить существующие пользовательские свойства/свойства в .pptx-файлах с помощью Apache POI
- 27. Как извлечь данные из файла
- 28. Как установить шрифт текста с помощью Apache POI PPT API?
- 29. Как извлечь данные из файла?
- 30. извлечь данные из файла
Вы заглянули в apache poi? –
Да, powerpointextractor - это класс пакета POI. он просто дает мне параметр getText(), который возвращает все содержимое файла в виде строки. –
Вы посмотрели на формат возвращаемой строки? Я бы предположил, что слайды будут каким-то образом разделены, и вы можете разбить строку на разделителе. – forgivenson