Я анализировал наилучший метод повышения производительности нашего индекса SOLR и, вероятно, покроет текущий индекс, чтобы позволить поиску распределяться.Разделение текущего индекса solr на осколки
Однако, учитывая, что наш индекс превышает 400 ГБ и содержит около 700 млн документов, переиндексирование данных кажется обременительным. Я занимался идеей дублирования индексов и удаления документов в качестве средства для более эффективного создания оштукатуренной среды.
К сожалению, модуль не может запросить внутренний цифровой идентификатор документа. Какие еще возможные стратегии разбиения можно использовать для удаления по запросу, а не для полного переиндекса?
Структура lucene, похоже, изменилась из статьи. После загрузки и извлечения дистрибутива lucene следующая команда выглядит как разбиение индекса. –
java -cp lucene-core-3.4.0.jar: contrib/misc/lucene-misc-3.4.0.jar org.apache.lucene.index.MultiPassIndexSplitter -out/indexes/shards -num 2/indexes/orig/индекс/ –