Продолжаем от вопроса: What is the difference between partitioning and bucketing a table in Hive ?ульев ведра против Перегородки
Предположим, что мы разделили таблицу сотрудников по столбцам заработной платы. Если мы напишем запрос выбора из этой таблицы с условием в условии where, которое основано на столбце зарплаты, тогда запрос будет работать быстро .. поскольку он будет извлекать только данные только из определенного раздела.
Однако, вместо разбиения на разделы, если мы ведем одну и ту же таблицу на основе столбца зарплаты и устанавливаем числа фиксированных кодов. Тогда в этом случае, если мы напишем один и тот же запрос, я хотел бы знать, как этот запрос получит выгоду от ведер? Может кто-нибудь объяснить?