Я хочу загрузить большой CSV-файл в мой кластер cassandra (в данный момент один узел).cassandra sstableloader загружает данные из csv с различными ключами раздела
Основываясь на: http://www.datastax.com/dev/blog/using-the-cassandra-bulk-loader-updated
Мои данные преобразуются в CQLSSTableWriter SSTables файлов, то я использую SSTableLoader для загрузки, что SSTables к столу Кассандры уже содержащий некоторые данные.
Этот файл CSV содержит различные ключи разделов.
Теперь давайте предположим, что используется кластер с несколькими узлами cassandra.
Мои вопросы:
1) Является ли процедура загрузки, что я использую правильно в случае многоузловой кластера?
2) Будут ли эти файлы SSTable разделяться SSTableLoader и отправлять узлам, ответственным за определенные ключи раздела?
Спасибо
Насколько велик ваш CSV-файл? –
Предположим, что мой CSV имеет 100 * 10^6 строк - я имею в виду, что это довольно большой файл, и использование команды CQLSH COPY не рекомендуется (как описано здесь: http://www.datastax.com/documentation/cql/ 3.1/cql/cql_reference/copy_r.html) «COPY FROM предназначен для импорта небольших наборов данных (несколько миллионов строк или меньше) в Cassandra. Для импорта более крупных наборов данных используйте загрузчик Cassandra.» –
Я использую Cassandra v2.0.11 –