2015-10-19 2 views
4

Я создал индекс в Elasticsearch со следующими настройками. После вставки данных в индекс с использованием Bulk API число docs.deleted постоянно увеличивается. Означает ли это, что документы автоматически удаляются, если да, то что я сделал неправильно?Документы автоматически удаляются в Elasticsearch после вставки

PUT /inc_index/ 
{ 
    "mappings": { 
    "store": { 
     "properties": { 
     "title": { 
      "type": "string", 
      "term_vector": "with_positions_offsets_payloads", 
      "store" : true, 
      "index_analyzer" : "fulltext_analyzer" 
     }, 
     "description": { 
      "type": "string", 
      "term_vector": "with_positions_offsets_payloads", 
      "store" : true, 
      "index_analyzer" : "fulltext_analyzer" 
     }, 
     "category": { 
      "type": "string" 
     } 
     } 
    } 
    }, 
    "settings" : { 
    "index" : { 
     "number_of_shards" : 5, 
     "number_of_replicas" : 1 
    }, 
    "analysis": { 
     "analyzer": { 
     "fulltext_analyzer": { 
      "type": "custom", 
      "tokenizer": "whitespace", 
      "filter": [ 
      "lowercase", 
      "type_as_payload" 
      ] 
     } 
     } 
    } 
    } 
} 

Выход "GET /_cat/indices?v" является таким, как показано ниже, "docs.deleted" непрерывно растет:

health status index pri rep docs.count docs.deleted store.size pri.store.size 
green open inc_index 5 1 2009877  584438  6.8gb   3.6gb 
+0

Был ли этот запрос на обновление отправлен навалом, что вызвало увеличение удаленного документа? Я столкнулся с подобной проблемой, не выдавая никаких запросов на обновление. Пожалуйста, дайте мне знать, как вы это решили, если позволили. благодаря – Moghira

ответ

6

Если объемные операции также включают в себя обновления для существующих документов (вставка/обновление для документов с тем же идентификатором) , то это нормально. В Elasticsearch, обновление является комбо операции удаления + вставок: https://www.elastic.co/guide/en/elasticsearch/guide/current/update-doc.html

И удаленные документы, которые вы видите есть документы отмеченных как удаленные. Когда происходит слияние сегментов Lucene, удаленные документы будут физически удалены с диска.

Смежные вопросы