2014-09-12 4 views
1

Можно ли загружать несколько таблиц из Кассандры параллельно в контекст?Как загрузить несколько таблиц из Cassandra параллельно?

я могу сделать по одному

val rdd = sc.cassandraTable("test", "words") 

, но если мне нужно присоединиться к 3 таблицы, я должен загрузить каждый из них поочередно?

Любой parallel альтернативный вариант можно было бы радовать.

ответ

0

Просто

  • вилки от некоторых нитей Akka представить каждую работу
  • обеспечить каждую работу не все ресурсы (например, три таблицы означает, что треть памяти и ядра)

Затем они будут работать параллельно

+0

Не могли бы вы поделиться примером кода для разметки потоков Akka? Я могу представить, как это будет выглядеть, но мне нужен код, чтобы подтвердить мое понимание. –

1

Вы можете сделать объединение, например

val rdd = sc.cassandraTable("test", "words").union(sc.cassandraTable("test", "numbers")) 

Последующий RDD будет запрошен раздел, поэтому он должен работать должным образом.

Смежные вопросы