В улье, как я могу удалить повторяющиеся записи? Ниже мой случай,Улей удалить повторяющиеся записи
Во-первых, я загружаю данные из таблицы продуктов в файл products_rcfileformat. Есть 25 строк записей на столе продукта
FROM products INSERT OVERWRITE TABLE products_rcfileformat
SELECT *;
Во-вторых, я загружаю данные из таблицы продуктов в products_rcfileformat. В таблице продуктов имеется 25 строк записей. Но на этот раз я не использую пункт
FROM products INSERT INTO TABLE products_rcfileformat
SELECT *;
OVERWRITE Когда я запрашиваю данные, которые он дал мне общее число строк = 50, которые являются правильными
Проверить от HDFS, это, кажется, HDFS сделать еще копия файла xxx_copy_1 вместо добавления к 000000_0
Теперь я хочу, чтобы удалить эти записи, Ри d из xxx_copy_1. Как я могу достичь этого в команде улья? Если я не ошибаюсь, я могу удалить файл xxx_copy_1, используя команду hdfs dfs -rm, следуя команде reerun insert overrite. Но я хочу знать, можно ли это сделать, используя пример команды hive, например, оператор delete?
Спасибо за ответ. Ссылка, которую вы предлагаете, выглядит нормально, и я попробую ее позже. Могу ли я узнать, что другой метод, упомянутый в вашем посте? – user664481