Мне нужно найти решение для индексации моей базы документов в словаре. Этот словарь содержит 3 миллиона фраз. У меня есть одна большая проблема: Мне нужно индексировать базу документов на этом словаре только с учетом того, что перестановка слов также принимается.
Например: У меня есть фраза в моем словаре как «красивый большой сад», но если документ содержит «большой красивый сад», он должен быть индексом как «красивый большой сад». Я много думаю, но я не мог найти нормальное решение в пределах solr, за исключением использования фильтра синонимов и перестановки слов, например, ниже: красивый большой сад => сад большой красивый, красивый сад большой, большой красивый сад, ... , но это невозможно, потому что мой словарь содержит 3 миллиона фраз, и многие из этих фраз имеют более 5 слов, поэтому вычисление 5! и сделать фильтр синонима невозможно. Есть ли кто-нибудь, кто может помочь мне с правильной идеей, я новичок в solr, для этого должен быть способ.Как индексировать документ с несколькими словами (фразами) и перестановкой слов?
Заранее спасибо Afrooz
Спасибо, но как я могу изменить порядок текста в документах, рассмотреть я даю документ 500 слов, который является история и движок должны индексировать этот документ в базе solr на этом словаре, Ok, мы можем сказать, что словарь отсортирован по алфавиту, но порядок слов в документе является вопросом для solr, я не могу отслеживать, где находится местоположение этого словаря термины внутри документа, и именно поэтому я использую solr, чтобы узнать и проиндексировать его для меня. – Afrooz
Вы можете использовать solr для индексации отдельных слов, а затем у нас есть плагин, чтобы проверить слова вокруг него на ваш словарь. – stark