Что быстрее/проще конвертировать в SQL, которые принимают SQL-скрипты в качестве входных данных: Spark SQL, который входит в число уровней скорости для запросов высокой задержки Hive или Phoenix? И если да, то как? Мне нужно сделать много upserts/join/grouping над данными. [hbase]Apache Phoenix vs Hive-Spark
Есть ли альтернатива сверху Cassandra CQL для поддержки вышеупомянутых (объединение/группировка в режиме реального времени)?
Я, скорее всего, привязан к Искры, так как хотел бы воспользоваться MLlib. Но для обработки данных, которые должны быть моим вариантом?
Спасибо, kraster
Вопрос о Hive-Spark. В этой диаграмме не упоминается, имеет ли Hive MR или Spark. Кажется, сравнение с Hive MR вместо Spark – sinu