2014-12-23 3 views
1

Когда я сохраняю один и тот же документ, например, 10 раз, нужно ли в десять раз больше места на диске? Или отдельные поля документа, сохраненные в индексе, или что-то еще, и документ ссылается только на этот индекс, если более одного документа имеют одинаковое значение для одного поля?Сделайте два равных документа в elasticsearch вдвое необходимым дисковым пространством

ответ

2

Хорошо ответ да и нет :). По умолчанию данные хранятся в агрегированной структуре данных, называемой обратным индексом lucene. В дополнение к этому данные, которые вы указали для индексации, также сохраняются в поле с именем _source. Поэтому мы можем с уверенностью предположить, что данные хранятся в двух разных форматах, где мы можем использовать только обратный индекс для поиска, но для извлечения фактических данных нам нужно извлечь его из _source. Так что если _source явно отключен, вы не увидите линейного роста размера диска. (Учитывая, что слияние сегмента делается для одного сегмента)

Если это не отключен, то данные должны быть сохранены как в _source (в качестве исходного JSON) и обратный индекс (Данные лексемы, а затем хранили)

Смежные вопросы