Как Hive эффективно обрабатывает обновления на столбцах, которые не разделены?Эффективность обновлений улей (версия 0.14)
Предположим, я хочу обновить строку для конкретной транзакции (не секционированной), как Hive обработает ее внутренне. Из того, что я понимаю, Hive сначала начнет поиск этого (что медленно), а затем обновит этот конкретный раздел (если есть), где хранится эта конкретная строка, содержащая этот транзакт. Даже если это предоставит пользователю абстракцию для обновления данных, но действительно ли будет эффективно выполнять множество обновлений?
Имеет ли улей даже поддержку индивидуального обновления строки? – Panther
Начиная с версии 0.14, Hive начал поддерживать обновления. Подробнее читайте здесь: https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions – Amar
Почему бы вам не потребоваться обновить строку SINGLE на Hadoop, используя Hive? – aviad