Мы храним большое количество твитов и блогов в solr.Solr Search Issue
Теперь, если пользователь выполняет поиск упоминаний Twitter, таких как @rohit, также возвращаются записи, которые содержат слово rohit. Даже если мы делаем точное соответствие «@rohit», я понимаю, это происходит из-за использования WordDelimiterFilterFactory, который расщепляет на специальных Charaters,
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.WordDelimiterFilterFactory
Как я могу заставить Solr не возвращаться без «@». Я не хочу удалять WordDelimiterFilterFactory, так как splitOnCaseChange и stemEnglishPossessive полезны? Надеюсь, я прояснился.
С уважением,
Рохит
Просто из любопытства, каковы преимущества использования WordDelimiterFilterFactory над whitespacetokenizerfactory? – sesmic
Вы не используете один над другим. При использовании WhitespaceTokenizerFactory вам действительно нужен WordDelimiterFilterFactory, чтобы использовать термины, используемые для поиска. –