2016-11-08 8 views
0

Теоретический вопрос,Impala GROUP BY разделенная колонка

Скажем, у меня есть таблица с четырьмя столбцами: A, B, C, D. Значения A и D равны, таблица разделена на столбец A.

Производительность разумная, не имеет значения, если я выдаю этот запрос SELECT SUM (B) GROUP BY A; или этот: SELECT SUM (B) GROUP BY D;

В разных словах я спрашиваю, есть ли увеличение производительности при использовании GROUP BY в секционированном столбце?

Благодаря

ответ

0

Обычно есть прирост производительности при использовании секционированной колонны на фильтре (ИНЕК в вашем SQL)

, поскольку оба запрос использует «полное сканирование таблицы» он не должен иметь много разницы между обоими запросами. Вы можете увидеть разницу, если в theres много разделов (например, около 50K), что приводит к ухудшению производительности запросов, но обычно это не так.

Смежные вопросы