сортировать по количеству слов в поле elasticsearch

У меня есть поле строки в моем документе. Теперь мне нужно отсортировать документы, основываясь на подсчетах слов этого поля. Как это сделать в elasticsearch?сортировать по количеству слов в поле elasticsearch

источник

2015-05-04 Jismy Zacharias

Лучшим подходом к этому было бы использование token count type. Но тогда нам нужно убедиться, что мы не нарушаем оригинальную строку. Для этого нам нужно использовать multi field и добавить дополнительное поле, чтобы отслеживать только токены.

Теперь отображение, как показано ниже, должны работать лучше для нас

{ 
    "tweet" : { 
     "properties" : { 
      "name" : { 
       "type" : "multi_field", 
       "fields" : { 
        "wordCount" : {"type" : "token_count"}, 
       } 
      } 
     } 
    } 
}

источник

2015-05-06 16:13:20

Использование term aggregation вроде как:

curl -H GET http://loclahost:9200/index name/_search?pretty=1 -d' 
    { 
     "aggs": { 
      "genders": { 
       "terms": { 
        "field": "gender" 
       } 
      } 
     } 
    }'

Примечание: для локонов команды check this

Здесь искать поле gender и получить результат всех пола в агрегации ведром и результат по умолчанию отсортированный порядок.

источник

2015-05-04 06:05:06 Yogesh

Это работает для полей одного слова, но терпит неудачу, когда несколько маркеров присутствуют как каждый маркер подсчитываются отдельно. 'Hello world',' Привет, меня зовут dave' -> 'Hello' x 2,' name' x 1, 'dave' x 1,' world' x 1 ('my' и' is' может быть или не быть в зависимости от используемого анализатора). – Basic

Лучше всего хранить подсчет маркера вместе с исходным полем. См. Документацию в основных типах здесь: http://www.elastic.co/guide/en/elasticsearch/reference/1.4/mapping-core-types.html#token_count

Затем вы должны отсортировать поля field.word_count (где поле является свойством «parent»).

источник

2015-05-04 21:03:51 samjudson

сортировать по количеству слов в поле elasticsearch

ответ

Смежные вопросы