2015-04-23 2 views
1

Как Hive эффективно обрабатывает обновления на столбцах, которые не разделены?Эффективность обновлений улей (версия 0.14)

Предположим, я хочу обновить строку для конкретной транзакции (не секционированной), как Hive обработает ее внутренне. Из того, что я понимаю, Hive сначала начнет поиск этого (что медленно), а затем обновит этот конкретный раздел (если есть), где хранится эта конкретная строка, содержащая этот транзакт. Даже если это предоставит пользователю абстракцию для обновления данных, но действительно ли будет эффективно выполнять множество обновлений?

+0

Имеет ли улей даже поддержку индивидуального обновления строки? – Panther

+0

Начиная с версии 0.14, Hive начал поддерживать обновления. Подробнее читайте здесь: https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions – Amar

+1

Почему бы вам не потребоваться обновить строку SINGLE на Hadoop, используя Hive? – aviad

ответ

0

Обновление уровня строки может быть неэффективным в hadoop, поскольку hasoop предназначен для большой обработки данных. Однако из версии Hive версии 0.14 поддерживаются обновления уровня строк в таблицах Hive, поддерживающих ACID. Ознакомьтесь с учебным пособием по улусу для получения дополнительной информации о том, как реализовать обновления уровня строк. https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-Update

Смежные вопросы