Я использую Porter стеммер, чтобы остановить слова, и вот проблема, я бег в:Зенда проблема Lucene со словом «ипотека»
Слова «ипотека» правильно стебли в «mortgag» Слова «залогодержатель» является (возможно, ошибочно) стеблями в «ипотеку»
есть около 100 документов со словом «ипотекой» Существует один документ со словом «залогодержателем»
Когда я построить индекс без сдачи " залогодержателя "в любых документах, все работает нормально: поиск" ипотеки "или" ипотеки "или" mor tgag "возвращает все 100 документов.
Когда я создаю индекс, а один из документов содержит «залогодержатель», поиск индекса для «ипотеки» возвращает только один документ с «залогодержателем» (который был сведен к «ипотеке»). Однако поиск «ипотеки» или «ипотеки» возвращает все 100 документов.
Единственный логический вывод, который я могу сделать из этой проблемы, - это lucene сначала ищет искомое слово, и если он не находит каких-либо результатов, он продолжает поиск слова. Таким образом, при поиске «ипотеки» он сначала находит «ипотеку», которая была основана на «залогодержателе» и прекращает поиск. Это правильное поведение, или это ошибка?