Я знаю, что есть несколько тем в Интернете, а также на SO, относительно индексирования и выполнения запросов в Lucene, но мне еще предстоит найти вопрос о том, стоит ли (или если да, сколько ?) создание полезных нагрузок будет влиять на производительность запросов ...Производительность полезной нагрузки в Lucene
Вот сценарий ...
Скажем, я хочу, чтобы индексировать коллекцию документов (в любом месте от 100К - 10М), и каждый документ имеет подраздел, который Я хочу иметь возможность искать отдельно (или, возможно, ранжировать выше, в зависимости от того, найдено ли совпадение в этом разделе).
Я рассматриваю возможность добавления полезной нагрузки (при индексировании) к любому термину, который появляется в этом подразделе, поэтому я могу эффективно выполнить это определение во время запроса.
Кто-нибудь знает какие-либо проблемы с производительностью, связанные с использованием полезных нагрузок, или даже лучше, можете ли вы указать мне любую онлайн-документацию по этой теме?
Спасибо!
EDIT: Я ценю альтернативные решения для моего сценария, но в случае, если мне нужно использовать полезную нагрузку в будущем, есть ли у кого-нибудь замечания относительно исходного вопроса о производительности запроса?
Посмотрите на Compass (http://www.compass-project.org/), он делает этот вид высокопроизводительных слоев на вершине Lucene намного проще. – skaffman
Спасибо за предложение, я буквально только что наткнулся на Компас сегодня днем, так что хорошо знать, что я могу быть на правильном пути. Я постараюсь сообщить, если мне повезет! – jeremyalan