2016-08-08 2 views
1

Я понимаю, что при создании таблиц ORC это значительно улучшит скорость. Однако можем ли мы улучшить его далее путем разбивки и балансировки таблицы ORC? Если да, то как сделать разметку и балансировку в существующей таблице ORC?Таблицы ORC и таблицы ковша

ответ

1

Вы можете ведро и разбивать таблицу ORC.

Разделы напрямую сопоставляются с каталогами в HDFS. Вы можете добавить ALTER TABLE и добавить раздел. Вам нужно будет восстановить раздел после вас. Все здесь хорошо объяснено: https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterPartition.

Лично я бы создал новую таблицу с динамическим разбиением и скопировал данные в новую таблицу.

+0

Вы могли бы разработать способ динамического разбиения? – Seen

Смежные вопросы