Эффективность обновлений улей (версия 0.14)

Как Hive эффективно обрабатывает обновления на столбцах, которые не разделены?Эффективность обновлений улей (версия 0.14)

Предположим, я хочу обновить строку для конкретной транзакции (не секционированной), как Hive обработает ее внутренне. Из того, что я понимаю, Hive сначала начнет поиск этого (что медленно), а затем обновит этот конкретный раздел (если есть), где хранится эта конкретная строка, содержащая этот транзакт. Даже если это предоставит пользователю абстракцию для обновления данных, но действительно ли будет эффективно выполнять множество обновлений?

источник

2015-04-23 Amar

Имеет ли улей даже поддержку индивидуального обновления строки? – Panther

Начиная с версии 0.14, Hive начал поддерживать обновления. Подробнее читайте здесь: https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions – Amar

Почему бы вам не потребоваться обновить строку SINGLE на Hadoop, используя Hive? – aviad

Обновление уровня строки может быть неэффективным в hadoop, поскольку hasoop предназначен для большой обработки данных. Однако из версии Hive версии 0.14 поддерживаются обновления уровня строк в таблицах Hive, поддерживающих ACID. Ознакомьтесь с учебным пособием по улусу для получения дополнительной информации о том, как реализовать обновления уровня строк. https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-Update

источник

2015-04-23 10:36:24

Эффективность обновлений улей (версия 0.14)

ответ

Смежные вопросы