2013-08-20 4 views
1

В главе 6 раздела Endeca MDEX Engine Advanced Development Guide (6.2.2 version) описывается, как построить XML-файл обновления для обновления, который будет дополнять предоставленный по умолчанию словарь, основанный на Endeca.Endeca - Где должны храниться файлы обновлений?

Однако в документации не указано, где должен быть размещен новый файл обновления для конечных файлов в файловой системе.

Является ли этот XML-файл предполагается разместить:

  • В// версия/CONF/папку Endeca вытекающих MDEX?
  • В эндеке/MDEX/версия/conf/stemming/пользовательская папка?
  • В любом месте файлового массива, а затем укажите полностью указанный путь к XML-файлу в строке конфигурации Dgidx с флагом -stemming-updates в DataIngest.xml?

ответ

2

После некоторых проб и ошибок, я получил эту работу.

Правильный подход заключается в том, чтобы включить полностью определенный путь к XML-файлу обновления пользовательского обновления в качестве аргумента параметра -stemming-updates для Dgidx.

Вот соответствующая часть моей Endeca/приложений/MyAppen/Config/скрипт/DataIngest.xml:

<dgidx id="Dgidx" host-id="ITLHost"> 
    ... 
    <args> 
    ... 
    <arg>--stemming-updates</arg> 
    <arg>/full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml</arg> 
    </args> 
</dgidx> 

я обнаружил, что --stemming обновления и фактический полностью указанный путь должен быть в раздельный <arg> теги; возникает ошибка, если вы попытаетесь поместить их в один и тот же тег arg, разделенные пробелом.

Возможно, существует определенная папка, в которой вы можете поместить файл XML обновления обновления, не требуя полного указания пути к файлу, но я обнаружил, что ни endeca/MDEX/version/conf/stemning, ни завершение/conf для этого. Когда я попробовал это, я получил ошибку в dgidx войти как:

ERROR 08/20/13 13:48:46.810 UTC (1377006526810)  DGIDX {dgidx,baseline}  InputFileStream can't open file "stemmingExtension.en.xml" for reading  [err=`No such file or directory',errno=2] 

Я также обнаружил, что есть ошибка в XML выборки, представленной в MDEX Advanced Guide Development Engine Endeca, 6.2.2 версии. В документации приведены первые две строки XML-файла:

<!DOCTYPE WORD_FORMS_COLLECTION SYSTEM "word_forms_collection_updates.dtd"> 
    <WORD_FORMS_COLLECTION_UPDATES> 

Это неверное описание. При попытке использовать файл в этом формате, эта ошибка возникает в журнале dgidx:

FATAL 08/20/13 13:56:33.533 UTC (1377006993533)  DGIDX {dgidx,baseline}  Errors while parsing word forms updates from file "full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml": Errors while trying to parse config stream "full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml": Error at file full/path/to/endeca/apps/MPen/config/script/stemmingExtension.en.xml, line 2, column 31; Message: Root element different from DOCTYPE 

Исправление это изменить DOCTYPE строку в файле XML, чтобы соответствовать корневой тег, например:

<!DOCTYPE WORD_FORMS_COLLECTION_UPDATES SYSTEM "word_forms_collection_updates.dtd"> 
    <WORD_FORMS_COLLECTION_UPDATES> 

Я открыл билет с поддержкой Oracle для этой (очевидной) ошибки.

+0

Я хотел добавить опцию --threads. При добавлении --threads , не было затронуто, если вы запустите компонент из Endeca-workbench (Endeca-workbench -> EAC-Admin-Console). Но это было затронуто, когда индексирование было запущено с помощью функции «/ atg/commerce/endeca/index/EndecaScriptService», которая напрямую вызывает «Endeca Application Controller», –

Смежные вопросы