2016-01-15 8 views
-2

Можем ли мы выполнить миграцию данных быстрее для большого количества данных с использованием искры apache? Необходимо перенести данные из mySQL в cassandra. Если бы мы могли это сделать, как это сделать?Как перенести данные с помощью Apache SPark?

ответ

1

Преимущество использования Apache Спарк для переноса данных является возможность распараллелить операцию (по крайней мере, распараллеливание запись в Кассандру).

Однако, в вашем случае, поскольку вы читаете от MySQL, я думаю, что это будет узким местом для чтения для миграции. Является ли ваш MySQL sharded или это один экземпляр?

+0

одиночный экземпляр. – AshwinK

+0

Если один экземпляр, ваша миграционная пропускная способность будет ограничена пропускной способностью вашего MySQL, нет никакой магии :( – doanduyhai

+0

Чтобы развернуть этот правильный ответ, вот руководство, которое может помочь вам приступить к работе: http://rustyrazorblade.com/ 2015/08/migrating-from-mysql-to-cassandra-using-spark/ – MarcintheCloud