Ошибка преобразования Memsql Spark-Kafka

У нас есть Spark Cluster, работающий под Memsql. У нас есть разные трубопроводы, настройка ETL такова, как показано ниже.Ошибка преобразования Memsql Spark-Kafka

Extract: - Спарк чтения сообщений из Кафки кластера (с помощью Memsql Кафка-Zookeeper)
Transform: - У нас есть собственная баночка развернутой для этого шага
нагрузки: - Данные из Transform стадии загружаются в Columnstore

у меня есть ниже сомнения:

Что происходит с Посланием опрашиваемого от Кафки, если задание не в Transform стадии - есть ли Memsql принимает Утеряно - Или данные теряются

Если данные потеряны, как я могу решить эту проблему, есть ли какие-либо изменения в конфигурации, которые необходимо сделать для этого?

источник

2016-01-31 Ravi Prakash

Как бы то ни было, по крайней мере, семантика не доступна в MemSQL Ops. Он находится на дорожной карте и будет присутствовать в одном из будущих выпусков Ops.

источник

2016-02-02 17:45:04 eklhad

Если вы еще этого не сделали, вы должны проверить трубопроводы MemSQL 5.5.

Это не основано на искре, (и преобразования выполняются несколько иначе, поэтому вам, возможно, придется переписать код), но теперь у нас есть родные потоки кафки.

Способ, которым мы получаем ровно один раз с родной версией, прост; хранить смещения в базе данных, такую же атомную транзакцию, что и фактические данные. Если что-то не удается и транзакция не совершена, смещения не будут зафиксированы, поэтому мы естественно и автоматически повторим этот диапазон смещения раздела.

источник

2016-09-29 18:12:17

Ошибка преобразования Memsql Spark-Kafka

ответ

Смежные вопросы