2009-12-23 4 views
3

Можно ли сравнить данные из нескольких индексов Lucene? Я хотел бы получить документы, которые имеют одинаковое значение в похожих полях (например, имя, фамилия) по двум индексам. Поддерживает ли Lucence запросы, которые могут это сделать?Lucene - сравнение данных по нескольким индексам

ответ

2

Ну, частично. Вы можете создавать идентичные схемы документов по индексам и, по крайней мере, правильно выбирать набор обращений. Однако, как показывает Lucene Similarity documentation, коэффициент idf (частота обратного документа) в подсчете Lucene зависит как от размера индекса, так и от количества документов, имеющих поисковый запрос в индексе. Оба эти фактора зависят от индекса. Поэтому одинаковое совпадение от разных индексов может иметь разные баллы в зависимости от этих факторов.

+0

Правильно. Но, я подозреваю, из приведенного примера точный порядок может быть не таким важным (так как он является типом запроса соответствия/отсутствия соответствия). Таким образом, игнорирование IDF должно быть в порядке. –