Я играю с Solr-powered для поиска моего webapp, и я решил, что лучше всего использовать DataImportHandler для обработки синхронизации с приложением через базу данных. Мне нравится элегантность просто проверки поля last_updated_date
. Хорошая вещь. Однако я не знаю, как обращаться с удалением документов с помощью этого подхода. То, как я это вижу, у меня есть два варианта. Я мог либо отправить явное сообщение Solr из клиента, когда документ был удален, либо я могу добавить «удаленный» флаг и оставить объект в базе данных, чтобы Solr заметил, что документ был изменен и теперь «удален» «. Я мог бы добавить фильтр запросов, который будет игнорировать результаты с удаленным флагом, но представляется неэффективным включать все удаленные документы в индекс Lucene. Что делают другие люди?Solr DIH - Как обрабатывать удаленные документы?
16
A
ответ
20
Это ваши варианты:
- Используйте DIH special commands $ deleteDocById или $ deleteDocByQuery (требуется Solr 1.4+)
- Используйте clean parameter из DIH удалить весь индекс перед импортом.
- Используйте preImportDeleteQuery, чтобы определить, что будет очищено перед импортом. (требуется Solr 1.4+)
- Используйте триггеры базы данных вместо DIH для управления обновлением индекса.
- Если вы используете какой-то ORM, используйте его возможности перехвата вместо DIH. Например, вы можете использовать hibernate events для обновления индекса при обновлении, вставке или удалении.
2
Мне нравится иметь «удаленный» флаг, поэтому я фактически не удаляю свои данные! Зависит от того, насколько вы параноики. Мне нравятся предложения Маурисио ...
+0
"deleted" flag = Хороший звонок! – Brian
Смежные вопросы
- 1. Solr + DIH + Tika: индексирование огромного количества файлов, как обрабатывать удаленные файлы?
- 2. Простейшая индексация Solr DIH
- 3. Можно ли просмотреть удаленные документы в Solr?
- 4. Solr DIH delta import
- 5. Solr DIH Mysql конфигурации
- 6. SOLR DIH, ошибка 500
- 7. SolR DIH file concatenation
- 8. Как масштабировать индексирование SOLR без использования DIH?
- 9. solr DIH - проблема с solr delta-import
- 10. SOLR DIH планировщик не работает
- 11. Solr SpatialRecursivePrefixTreeFieldType и MySQL DIH
- 12. Как удалить логически удаленные документы из индекса Solr?
- 13. Solr как удалить физически удаленные документы с DataImportHandler
- 14. Solr dih последнее временное смещение индекса
- 15. Rethinkdb - как восстановить удаленные удаленные документы
- 16. Как ускорить SOLR DIH с подзапросами
- 17. Как использовать агрегатные функции в Solr DiH?
- 18. Как настроить планировщик DIH на Solr 5.1.0
- 19. Как solr удалит документы
- 20. Удаленные документы Sphinx
- 21. Solr DIH импортирует несколько значений для столбца
- 22. Как обрабатывать документы PDF?
- 23. Как обрабатывать большие документы?
- 24. SOLR & Sybase: ошибка полного импорта DIH
- 25. Solr MailEntityProcessor Конфигурация DIH продолжает загружаться
- 26. SOLR DIH delta import vs Update
- 27. Может ли Solr DIH делать атомарные обновления? `
- 28. SOLR как я могу вызвать удаление с помощью $ deleteDocById с DIH
- 29. эффективный способ получить удаленные документы
- 30. ElasticSearch не удаляет удаленные документы
Это отличный список! Я все еще использую 1.3, но это убедительная причина для поиска переключения. –
Да, Solr 1.4 просто пошел RC, окончательный релиз неминуем. –
Привет, Маурисио, есть ли хорошие примеры использования preImportDeleteQuery, когда вы делаете дельта-импорт на удаленные документы? – Joyce