Я планирую использовать Elasticsearch в основном для анализа данных. У меня есть большой документ со многими, moslty числовыми (до 4 байтов) атрибутами. Большинство полей в моем документе содержат около 30% значений. Если я правильно понимаю, я могу воспользоваться функцией Doc Values, которая аналогична расположению столбчатых данных в некоторых базах данных. Мне было интересно, как Elasticsearch/Lucene сохранит эти данные. Используются ли какие-либо компрессии (например, длина прогона) или плотная компоновка данных, где нули будут занимать одинаковое пространство на хранении в виде значений?Elasticsearch/Lucene null обработка значений doc
ответ
Поведение ElasticSearch по умолчанию заключается не в том, чтобы добавлять это поле вообще в случае значений NULL
. Вы можете принудительно отобразить поле с помощью null_value
, но для типов, где поддерживается NULL
. Например: long
Поле не может быть отображено со строкой null_value
.
Чтобы решить вопрос, ElasticSearch не будет выделять пространство по умолчанию для полей, отсутствующих в документе. Но вы можете столкнуться с MissingFieldException
в случае, если вы запрашиваете какое-то поле, которое никогда не имело значения. Чтобы этого избежать, сопоставьте свои поля явно перед индексацией. Если вы явно указали, не забудьте установить свойство null_value
этого поля вне диапазона ввода данных.
Да, мое намерение состояло в том, чтобы сопоставить все поля, которые я хочу фильтровать. Однако это вызывает вопрос. Неужели оно установит недостающее значение в 0? Я имею в виду, что 0 является допустимым значением и не должно использоваться в качестве замены для null. –
Извините, предложение, которое я написал, интерпретировало неправильное сообщение. Только что отредактировал мой ответ. ES не будет устанавливать значение по умолчанию 0 для отсутствующих полей. Он не будет устанавливать значение вообще, и вы можете оказаться в «MissingFieldException», даже если вы явно указали. На более безопасной стороне вы можете установить значение поля «null_value» для некоторого значения вне вашего диапазона ввода (например long.MIN_VALUE или int.MIN_VALUE) – NutcaseDeveloper
- 1. Обработка значений NULL в Hive
- 2. XML Doc - нулевая обработка
- 3. Обработка PDF и DOC
- 4. Обработка значений NULL в выражении CASE
- 5. Настроить pandas read_sql_query Обработка значений NULL?
- 6. Обработка значений NULL в случае заявления
- 7. Обработка значений NULL в регрессии R
- 8. Обработка значений NULL при установке значения переменной
- 9. Обработка Null в WriteXml
- 10. Обработка Derby значениями NULL
- 11. C# Обработка нулевых значений
- 12. Обработка NULL значений в SQL Query, который использует SUM
- 13. Обработка значений null в Command.ExecuteScalar с использованием C#
- 14. Обработка TableAdapter Null значения
- 15. Обработка исключений Null Pointer
- 16. обработка SQLite из NULL
- 17. Обработка исключения null указателя
- 18. Обработка десятичного формата null
- 19. Обработка null в JSONObject
- 20. Обработка null в Linq
- 21. URL-адрес Google Doc Download null:
- 22. Open doc file is null IIS 7.5
- 23. Обработка нулевых значений на улей
- 24. Обработка нулевых значений в Freemarker
- 25. Обработка null BigDecimals в потоках java8
- 26. Обработка нулевых значений в protobuffers
- 27. Обработка нулевых значений из ResultSet
- 28. PHP - обработка массива значений
- 29. Обработка «пустых» значений
- 30. Обработка значений группировки независимо
будет [это] (https://www.elastic.co/guide/en/elasticsearch/reference/current/null-value.html) помощь? – pratikvasa