2015-06-02 2 views
0

Меня интересует интеграция Cassandra и Hadoop, точнее, использование Cassandra для ввода заданий Hadoop. Каждый узел Кассандры также является узлом Hadoop.Интеграция Cassandra-Hadoop

Я нашел эти учебники 1 и 2, которые несколько объясняют интеграцию. Я новичок в Cassandra, поэтому я все еще разбираюсь в некоторых вещах.

Мой вопрос: мне всегда нужно использовать весь ColumnFamily (table) в качестве входных данных для задания MapReduce, или есть способ указать, какие строки вы хотите (по крайней мере, по ключу)?

Если используется весь ColumnFamily, будет ли правильный подход испускать только строки, которые удовлетворяют некоторому условию из Mapper? Или есть лучший способ?

ответ

0

Существует official doc о текущем состоянии интеграции cassandra и hadoop.

Мне всегда нужно использовать весь столбец Column (таблица) в качестве входных данных для задания MapReduce, или есть способ указать, какие строки вы хотите (по крайней мере, с помощью ключа)?

Нет, вы всегда можете указать строки, используя CqlConfigHelper.setInputWhereClauses вариант CqlPagingInputFormat.