У меня есть 4 узла кластера в datastax 4.6 с 2 искрами, 1 solr и 1 узел cassnadra. Я беру запрос на выполнение sparksql-запроса (используя контекст hive) с удаленных серверов с помощью java. В этом процессе всякий раз, когда я подключаюсь к искрообразованию и использованию hivecontext, выполнение запроса занимает до 2 минут. Может быть, из-за метастабильности улья и по мере роста числа таблиц увеличивается время его выполнения.Пул соединений SparkSQL
Может ли кто-нибудь предложить какое-либо решение? Возможно ли объединение объектов/соединений?
Благодаря
Как быстро запрос в искровой оболочке? – phact
В оболочке Spark также первый запрос в контексте улья занимает время. – user3632180