Я использую solr для хранения пути к файлу и моего «id» (uniquekey) и индексирования его содержимого. Когда я изменяю содержимое файла и повторно индексирую его, он заменяет содержимое файла в индексе. В любом случае, я могу сохранить старую версию файла под тем же идентификатором? Я попробовал добавить параметр overwrite = false без везения. Я использую solr 6.1.0Solr Индексирование дубликатов документов
ответ
Я думаю, вы не можете сделать это под тем же id
, поскольку id
- это uniquekey
.
Даже его невозможно достичь на RDBMS
типа. Это может быть достигнуто путем предоставления другого идентификатора и поддержания отношений нового идентификатора (где содержимое документа изменяется, рассматривает его как новый документ с новым идентификатором), а затем имеет отношение нового идентификатора и старого идентификатора.
У вас также может быть аналогичная концепция для solr, но для каждого документа вам нужно иметь другое поле типа id и older_id
.
Здесь, в older_id
, вы можете указать идентификатор документа, который имеет более раннюю версию и содержит содержимое старого документа.
И с этим вашими старыми документами не будет удален из solr
, поскольку они будут иметь новый документ и новый id
и older_id
предыдущего документ id
.
- 1. Solr Индексирование времени документов
- 2. индексирование документов с помощью Solr
- 3. Индексирование Solr -
- 4. Индексирование Несколько документов и сопоставление с уникальным идентификатором solr
- 5. Индексирование встроенных документов mongoDB (в массиве) с помощью Solr
- 6. индексирование документов в Apache Solr с использованием библиотеки php-curl
- 7. Lucene Индексирование нескольких документов
- 8. Индексирование pdf-документов
- 9. awk динамическое индексирование документов
- 10. Индексирование документов с websolr
- 11. Индексирование файлов документов
- 12. SOLR индексирование и поиск?
- 13. Как автоматизировать индексирование solr?
- 14. Solr индексирование, поиск stemming
- 15. Solr пятно PDF индексирование
- 16. SOLR 4,4 индексирование постепенно
- 17. Индексирование wikipedia с solr
- 18. Solr индексирование объектов HTML
- 19. Solr индексирование многозначных полей
- 20. Solr: индексирование fb2 файлов
- 21. Автоматическое индексирование в Solr
- 22. SolrJ - асинхронно индексирование документов с ContentStreamUpdateRequest
- 23. Solr BlockJoin Индексирование для Solr 4.10.1
- 24. Solr индексирование, но numdocs возвращается 0
- 25. Count игнорирование дубликатов документов
- 26. Поиск дубликатов документов
- 27. Индексирование полнотекстовых и описательных метаданных в Solr
- 28. Индексирование HTML с помощью solr
- 29. Lucene/Solr - Индексирование публикаций/текстов
- 30. Solr Индексирование нескольких объектов json