Можно ли передавать данные с Redshift на Elasticsearch?

Я работаю над чем-то, связанным с сервисом elasingearch Amazon. Для этого мне нужно получить данные от Amazon Redshift. Данные, которые нужно переместить, огромны, т.е. 100 GB. Есть ли способ получить его прямо из Redshift или это двухэтапный процесс, такой как Redshift-> s3-> elasticsearch?Можно ли передавать данные с Redshift на Elasticsearch?

источник

2015-11-06 AV94

Похоже, что нет прямого конвейера для передачи данных в elasticsearch из Redshift. Один альтернативный подход состоит в том, чтобы сначала сбросить данные в S3, а затем вставить в elasticsearch.

источник

2015-11-10 04:58:22 AV94

Я вижу, по крайней мере в теории, 2 возможные подходы к перенося данные из Redshift в Elasticsearch:

Logstash, используя JDBC input plugin
elasticsearch-jdbc

источник

2015-11-17 15:18:38

Существуют ли какие-либо практические ограничения для вышеуказанных подходов? – AV94

Не GZIP данные разгружаются.
Использовать объемную нагрузку на эластичный
Используйте большое количество записей в объемной нагрузке (> 5000) - меньшее количество большого объема грузы лучше, чем более мелкие.
При работе с эластичным поиском AWS существует риск попадания в пределы объема массовой очереди.
Обработать один файл в лямбда, а затем рекурсивно вызвать функцию лямбда с событием
Перед рекурсией подождите несколько секунд -> setTimeout. При ожидании убедитесь, что вы не простаиваете в течение 30 секунд, потому что ваша лямбда остановится.
Не используйте создание объекта s3 для запуска вашей лямбды - вы в конечном итоге должны вызывать несколько лямбда-функций, вызываемых одновременно.
Не беспокойтесь, пытаясь положить кинезис посередине - выгрузка ваших данных в кинезис почти наверняка поразит пределы нагрузки в кинезисе.
Отслеживайте упругий поиск насыпного размера очереди с чем-то вроде этого:

curl https://%ES-SERVER:PORT%/_nodes/stats/thread_pool |jq 
    ‘.nodes |to_entries[].value.thread_pool.bulk’

источник

2017-07-24 18:53:24 olekb

Можно ли передавать данные с Redshift на Elasticsearch?

ответ

Смежные вопросы