Я использую logstash кормить ежедневные показатели прокатки в elasticsearch, что-то вроде этогоElasticsearch ежемесячно прокатные показатели
output {
elasticsearch {
....
index: myindex-%{+YYYY.MM.DD}
}
}
Теперь выясняется, что нужно использовать ежемесячно прокатки индексов вместо этого, после того, как смотреть на http://logstash.net/docs/1.4.1/outputs/elasticsearch.html#index
Но я все еще чувствую смущение, поэтому ответ так же просто, как использовать myindex-%{+YYYY.MM}
, а индекс будет катиться в конце каждого месяца?
Update: Вот примеры «же» событие (то есть же _id
поле) индексируется на два разных дня
на день, это индексируется
{_id: 123, message: "old message}
на следующий день B, это индексируется
{_id: 123, message: "updated message}
так, если день и день B принадлежит к двум отдельным показателям, у меня будет 2 события, если мой запрос оглядки все эти индексы. Чтобы устранить дублирование, при индексировании события B, я сделаю дополнительную проверку запросов с помощью _id
и удалит ранее существующее событие A, а затем проиндексирую на B. если это ежедневные индексы, со временем я боюсь, что мой запрос на поиск _id будет быть дороже, что ежемесячно может улучшиться. И последнее, но не менее важное: если событие, найденное из моего чека, существует в текущем индексе (с сегодняшнего дня до этого месяца), оно не удалит событие, но позволит elasticsearch сделать update
на основе _id
(по сути, это удаление/создание, просто мне не нужно делать это в моем коде)
Благодаря
Да, это так просто. –
Спасибо Jettro, я смог протестировать с изменением системного времени и времени между индексацией 2 события и увидеть 2 создаваемых индекса. –
Мне любопытно ... почему «нужно» использовать месячные индексы? –