2016-05-30 3 views
0

Я новичок в Lucene Elasticsearch. Я не знаю, как с этим бороться. В документации я не нашел то, что искал.коррекция с lucene elasticsearch

  • У меня есть текст и содержит некоторые неправильные неправильные слова, которые я хочу исправить с помощью большой базы данных, содержащей правильные слова.

  • Как у меня есть большая база данных, я подумал о Lucene Slasticsearch для быстрого изучения результатов в базе данных.

Вопрос

Я знаю, что мы используем Lucene Slasticsearch для поиска и индексации, но я не знаю, можем ли мы сделать исследование с неправильным словом и возвращает правильные слова, которые «похожи» неправильного.

спасибо.

ответ

0

Было бы полезно, если бы вы указали, как вы определяете слово, которое должно быть схожим, например, только на основе орфографии или фонетически.

Предполагая, что вы хотите сделать исправление на основе орфографии, лучший подход - использование пользовательских анализаторов, а Elasticsearch имеет целую кучу вариантов для этого. https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-analyzers.html https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-custom-analyzer.html

Что вам нужно сделать, это:

  1. Первое решение, на какой тип фильтра и токенизатор вы хотите использовать.
  2. Затем добавьте анализатор в настройки индекса.
  3. Затем добавьте анализатор в ваше сопоставление.
Смежные вопросы