Каковы все рекомендуемые методы оптимизации в Hive?

Ну, я знаю несколько методов оптимизации, таких как «Разделение и Bucketing» при написании запроса. Запуск улья в режиме TEZ. Но, кроме этого, есть другие методы оптимизации, которые есть в улье.Каковы все рекомендуемые методы оптимизации в Hive?

источник

2016-06-06 Teja Dogiparthi

Вы можете задать по крайней мере следующие параметры для оптимизации производительности: -

set set hive.exec.reducers.max=no_of_reducers; - нет восстановителей для параллельной обработки.

set hive.exec.reducers.bytes.per.reducer=value_in_bytes; - равномерно распределить нагрузку на каждый редуктор.

set hive.auto.convert.join=true; - автоматически преобразует присоединяется к mapjoins во время выполнения , если это возможно,

set hive.enforce.bucketing = true; - если таблица bucketed вам нужно написать этот параметр, нет. из ковшей будет равно no. редукторов.

источник

2016-06-06 12:25:46 syadav

Есть много методов:

Использование Tez
Использование ORCFile
Использование векторизации
Оптимизация затрат запросов на основе
Написание правильного и эффективного SQL

Пожалуйста, обратитесь ниже пост hortonworks для более Детали:

http://hortonworks.com/blog/5-ways-make-hive-queries-run-faster/

источник

2016-06-06 09:17:49

Каковы все рекомендуемые методы оптимизации в Hive?

ответ

Смежные вопросы