@Nishant: вы должны сделать небольшую домашнюю работу, прежде чем задавать общие вопросы на этом форуме. В любом случае, вот краткая ссылка для подробного объяснения внешних таблиц улья в целом - External Hive Tables
Когда вы бросаете внутреннюю таблицу, она отбрасывает данные, а также бросает метаданные. У вас больше не будет доступа к данным
Когда вы бросаете внешнюю таблицу, она только снижает метаданные. Это означает, что улей сейчас не знают данных. Он не касается самих данных. Теперь вы можете получить доступ к данным и выполнить любые операции (при необходимости). Внешние таблицы также являются предпочтительными, когда вам нужно пит-стоп для ваших данных, а затем сбросить все данные, чтобы управляемый стол для ульев opertaions
Кроме того, вот заметки из другой stackoverflow нити
Используйте внешние таблицы, когда:
- Данные также используются за пределами улья. Например, файлы данных считываются и обрабатываются существующей программой, которая не блокирует файлы.
- Данные должны оставаться в базовом местоположении даже после ТАБЛИЦЫ DROP. Это может применяться, если вы указываете несколько схем (таблиц или представлений) в одном наборе данных или если вы выполняете итерацию через различные возможные схемы.
- Вы хотите использовать пользовательское местоположение, такое как ASV.
- Улей не должен владеть данными и настройками управления, dirs и т. Д., У вас есть другая программа или процесс, которые будут делать эти вещи.
- Вы не создаете таблицу на основе существующей таблицы (AS SELECT).
таблицы Использование ВНУТРЕННИЕ когда:
- Данные временно.
- Вы хотите, чтобы улей полностью управлял жизненным циклом таблицы и данных.
Вы хотите, чтобы Hive полностью управлял жизненным циклом таблицы и данных.
Надеюсь, это полезно.
Спасибо всем за их вклад. Это было полезно – earl