У меня есть огромная таблица с дубликатами 500 ГБ и с разделами, имеют почти 2 миллиарда записей.экспорт уникальных строк с использованием строки id
Я планирую написать условие, в котором, если 3 значения столбцов совпадают, затем выберите эти записи (например, у нас есть 4 повторяющиеся записи). И возьмите экспорт одной из записей с минимальным/минимальным номером строки.
Я знаю, что могут быть разные методы, такие как удаление или создание новой таблицы xyz. Но мы решили подойти с использованием опции запроса в экспорте. Поэтому, пожалуйста, помогите мне, если кто-нибудь может получить мне правильный синтаксис.
Я пытался с:
query= schema.table:"WHERE ROWID <>
(SELECT MAX(ROWID) FROM schema.table A WHERE A.col1 = A.col1 AND A.col2 = A.col2 AND A.col3 = A.col3)"
Но это, вероятно, займет дубликаты, я попытался только с = и < = знак и то не помогает мне. Он не экспортирует какие-либо строки, говорит экспорт 0rows Итак, любые предложения?
Внимание, это не будет экспортировать уникальные строки, но те, у которых есть дубликаты. –
i'am изменить ответ, thx, я думаю, что говорят только о разрезах –