Данные сами по себе являются одним или несколькими индексами lucene, так как вы можете иметь несколько осколков. То, что вам также нужно сделать для резервного копирования, - это состояние кластера, содержащее все виды информации о кластере, доступные индексы, их сопоставления, осколки, из которых они состоят и т. Д.
Все это находится в каталоге data
, хотя вы можете просто скопируйте его. Его структура довольно интуитивно понятна. Прямо перед копированием лучше отключить автоматический сброс (для резервного копирования последовательного представления индекса и предотвращения записи на нем при копировании файлов), выпустить ручную флеш, отключить выделение. Не забудьте скопировать каталог со всех узлов.
Кроме того, следующая основная версия elasticsearch будет предоставлять новый снимок/восстановление api, который позволит вам выполнять инкрементные снимки и восстанавливать их также через api. Вот связанный вопрос github: https://github.com/elasticsearch/elasticsearch/issues/3826.
Это удобно, приветствие thx! –
В то время как очень удобно, моментальный снимок действительно не экспортирует ваши данные в пригодном для использования формате (json, csv и т. Д.). – Evan
@ Функция рендеринга Anndreas Neumann Может делать резервную копию подмножества документов в индексе. Предположим, что индекс имеет 1000 документов, и я хочу сделать резервную копию всего 500 документов. Я хотел бы сделать это, потому что я хочу импортировать набор документов и восстановить в каком-то другом индексе, чтобы выполнить некоторое нагрузочное тестирование. Я не требую, чтобы все документы для моей задачи и индекс были огромны, и я не хочу делать снимок всех данных, так как потребуется много времени –