Можем ли мы выполнить миграцию данных быстрее для большого количества данных с использованием искры apache? Необходимо перенести данные из mySQL в cassandra. Если бы мы могли это сделать, как это сделать?Как перенести данные с помощью Apache SPark?
-2
A
ответ
1
Преимущество использования Apache Спарк для переноса данных является возможность распараллелить операцию (по крайней мере, распараллеливание запись в Кассандру).
Однако, в вашем случае, поскольку вы читаете от MySQL, я думаю, что это будет узким местом для чтения для миграции. Является ли ваш MySQL sharded или это один экземпляр?
одиночный экземпляр. – AshwinK
Если один экземпляр, ваша миграционная пропускная способность будет ограничена пропускной способностью вашего MySQL, нет никакой магии :( – doanduyhai
Чтобы развернуть этот правильный ответ, вот руководство, которое может помочь вам приступить к работе: http://rustyrazorblade.com/ 2015/08/migrating-from-mysql-to-cassandra-using-spark/ – MarcintheCloud