2015-05-28 3 views
1

Я пытаюсь импортировать CSV в семью столбца в Кассандре, используя следующий синтаксис:Cassandra RPC тайм-аут на импорт из CSV

copy data (id, time, vol, speed, occupancy, status, flags) from 'C:\Users\Foo\Documents\reallybig.csv' with header = true; 

Файл CSV составляет около 700 Мб, а по какой-то причине, когда я бегу эта команда в cqlsh я получаю следующую ошибку:

«Запрос не завершен в течение rpc_timeout».

Что происходит не так? В CSV нет ошибок, и мне кажется, что Cassandra должна всасывать этот CSV без проблем.

ответ

1

Папка установки Cassandra имеет файл .yaml для установки значения времени ожидания rpc, которое является «rpc_timeout_in_ms», вы можете изменить значение и перезапустить cassandra.

Но другой способ сократить ваш большой csv для умножения файлов и ввода файлов по одному.

1

Это на самом деле оказалось моим собственным неправильным толкованием COPY-FROM, поскольку CSV составлял около 17 миллионов строк. В этом случае лучшим вариантом было использование примера загрузчика и запуск sstableloader. Однако ответ выше, безусловно, будет работать, если я захочу разбить CSV на 17 различных CSV, что является вариантом.

Смежные вопросы