Проверка SQL дубликатов в одном столбце и удаление другого

Мне нужно удалить около 300 000 дубликатов в моей базе данных. Я хочу проверить столбец Card_id на наличие дубликатов, а затем проверить наличие повторяющихся временных меток. Затем удалите одну копию и сохраните ее. Пример:Проверка SQL дубликатов в одном столбце и удаление другого

| Card_id | Time |  
| 1234 | 5:30 |  
| 1234 | 5:45 |  
| 1234 | 5:30 |  
| 1234 | 5:45 |

Так остальные данные будут:

| Card_id | Time |  
| 1234 | 5:30 |  
| 1234 | 5:45 |

Я попробовал несколько различных ВЕЬЕТЕ, и слияние в новую таблицу, но не повезло.

ОБНОВЛЕНИЕ: Сработало!

Хорошо после многих сбоев я получил это для работы в DB2.

delete from(
select card_id, time, row_number() over (partition by card_id, time) rn 
from card_table) as A 
where rn > 1

rn приращения при наличии дубликатов для card_id и времени. Дублированный или второй rn будет удален.

источник

2013-07-31 Nexus

У вас есть 'id' столбец для идентификации записей однозначно? –

У этой информации нет уникального идентификатора. – Nexus

Мы имеем дело с ** дубликатами ** или можем ли вы иметь три (или более) строки с одинаковыми? –

я настоятельно рекомендую вам принять этот подход:

create temporary table tokeep as 
    select distinct card_id, time 
    from t; 

truncate table t; 

insert into t(card_id, time) 
    select * 
    from tokeep;

То есть, хранить данные, которые вы хотите. Усекайте таблицу, а затем восстановите ее. Усекая таблицу, вы можете сохранить триггеры и разрешения и другие вещи, связанные с таблицей.

Этот подход также должен быть быстрее, чем удаление многих и многих дубликатов.

Если вы собираетесь сделать это, вы должны вставить правильный идентификатор, а также:

create temporary table tokeep as 
    select distinct card_id, time 
    from t; 

truncate table t; 

alter table t add column id int auto_increment; 

insert into t(card_id, time) 
    select * 
    from tokeep;

источник

2013-07-31 19:24:16

+1 Вот как это сделать. –

Будет ли это работать, если у меня будет больше столбцов? – Nexus

@Nexus. , , Это будет работать для любого количества столбцов. –

Если у вас нет Primary key или Candidate key, вероятно, нет никакой возможности, используя только одну команду. Попробуйте решение ниже.

Создать таблицу с дубликатами

select Card_id,Time 
    into COPY_YourTable 
    from YourTable 
    group by Card_id,Time 
    having count(1)>1

Удалить дубликаты с помощью COPY_YourTable

delete from YourTable 
    where exists 
    (
    select 1 
    from COPY_YourTable c 
    where c.Card_id = YourTable.Card_id 
    and c.Time = YourTable.Time 
    )

Копирование данных без дубликатов

insert into YourTable 
    select Card_id,Time 
    from COPY_YourTabl

источник

2013-07-31 19:27:30 Parado

Проверка SQL дубликатов в одном столбце и удаление другого

ответ

Смежные вопросы