2013-04-24 2 views
1

В настоящее время я реализую инструмент Oracle OutsideIn Search and Export в Java для извлечения метаданных и содержимого разных файлов. Я смог сделать это по нескольким файлам внутри папки, но мне не удалось извлечь файлы, встроенные в другой файл. Я хотел бы знать, возможно ли это в поиске и экспорте.Извлечение нескольких встроенных файлов через Oracle Поиск и экспорт

Если нет, я бы пошел на CleanContent, но он принимает только файлы Microsoft и PDF.

ответ

1

Поиск Экспорт может конвертировать или извлекать вложенные файлы из архивов или в другие типы файлов. Мы различаем три разных типа вложений, каждый из которых имеет свой собственный контроль над их преобразованием. Эти три типа - это архивные поддоны, вложения электронной почты и общие вложения. По умолчанию первые два конвертируются, а третье - нет. Чтобы включить общее преобразование вложений, установите флаг SCCEX_XML_EMBEDDINGS в опции SCCOPT_XML_SEARCHML_FLAGS. Если вы используете приложение примера экспортера, поставляемое с SDK, попробуйте включить следующее в CFG-файле.

embeddingsflag да

Если вы пытаетесь извлечь двоичную копию вложения, она становится процессом три этапа. При первоначальном преобразовании установите флаг SCCEX_XML_PRODUCEOBJECTINFO в опции SCCOPT_XML_SEARCHML_FLAGS. Используйте эту информацию для желаемых вложений, чтобы заполнить структуру SCCDAOBJECT, которая передается в DAOpenDocument. HDoc, который возвращается из этой функции, может быть передан в DASaveInputObject для сохранения двоичной копии вложения. Это работает для любого из трех типов вложений, описанных выше. Не существует примера Java-приложения, демонстрирующего этот процесс.

Смежные вопросы