2014-11-20 3 views
0

Я установил SOLR для автоматического создания идентификаторов для моих документов, следуя этому руководству: https://wiki.apache.org/solr/UniqueKey, который работает по назначению.Идентификация документов несколькими уникальными ключами в solr

Теперь, при вставке документа, я хотел бы проверить/убедиться, что поле url (только строка) уникально для всех документов в индексе. Поэтому всякий раз, когда добавляется новый документ, он должен просто обновлять любой существующий документ, если документ уже существует с этим конкретным URL-адресом. Уникальный идентификатор используется для идентификации документа в другой части системы.

Я попытался добавить url в поле url, но он просто игнорируется, и, тем не менее, можно добавить документ с уникальным URL-адресом.

Я использую SOLR 4.10.2.

Любая помощь очень ценится!

ответ

0

Вы можете предотвратить ввод дубликатов в индекс с помощью функции «Де-дублирование» Solr. Пожалуйста, посмотрите на wiki для конфигурации и более подробную информацию: https://cwiki.apache.org/confluence/display/solr/De-Duplication

Существует также флаг «overwriteDupes», который, как я считаю, вызывает команду «update», которая переопределяет старые значения, хотя это не ясно документировано в вики.

Смежные вопросы