2016-01-22 2 views
1

В настоящее время я работаю над поисковой системой Sphinx, и у меня есть некоторые проблемы с wordforms и libstemmer. Вот мой конфиг:Sphinxsearch Wordforms + Libstemmer

wordforms = /etc/sphinxsearch/wordforms.txt 

morphology = libstemmer_french, libstemmer_english 

http://sphinxsearch.com/blog/2015/09/09/sphinx-2-2-10-release/ 

Когда libstemmer активируется, некоторые ассоциации в файле словоформ не работают. Например: girafe> giraffe, science> sciense, aztec> azteque, louie> louis, ... Когда я делюктивирую опцию libstemmer, все работает нормально.

Таким образом, я не понимаю, как работать с обоими libstemmer и словоформ, так libstemmer, как предполагается, будет называться после словоформ, не перед тем.

ответ

0

Поскольку libstemmer должен быть вызван после словоформ, а не раньше.

Применяется после. НО словоформы реализуют «исключения морфологии» - т. Е. Если слово изменяется в текстовых формах, то морфология НЕ применяется. (Только если не словоформа subsitition не морфология применяется)


О единственной надеждой это лакомый ...

Начиная с версии 2.1.1-бета, ..., если начинается линия с тильдой («~») словоформа будет применяться после морфологии, а не раньше.

... так что можно положить слова libstemmed в словоформы, а затем вы получите оба набора обработки.

+0

Я попытался добавить тильду перед моими примерами, но проблема остается. – Relyss

Смежные вопросы