2012-04-06 4 views
0

Чтение файла документа с использованием Apache POI & docx4j.Чтение файла документа с использованием Apache POI и docx4j

я прочитал файл DOC с использованием docx4j & даже с Apache POI, но проблема в том, когда я извлечь данные из него только вернуть TEXT не Изображения. & даже я не любое обозначение нового пункта начала или пункт закончился ..

есть ли решение для этого ..

ответ

0

Из того, что я прочитал вашу проблема в том, что возвращаемые данные из дока только text (string type), это потому, что данные, введенные в растровые изображения, также являются массивом символов.

Возможно, вы захотите использовать синтаксический анализатор, который распознает последовательность символов и преобразует его в растровые расширения.

+0

но даже если есть изображение в .doc-файле, я просто получаю только символ «SQUIRE» .... – Wolverine

+0

У Java есть несколько способов, когда дело доходит до чтения файла, одним из которых является imageIO, вот пример: http: //www.exampledepot.com/egs/javax.imageio/BasicImageRead.html – Dennis

Смежные вопросы