Что такое быстрый SQL для получения дубликатов в наборах данных с сотнями тысяч записей. Обычно я использую что-то вроде:Самый быстрый сценарий «Получить дубликаты» SQL
SELECT afield1, afield2 FROM afile a
WHERE 1 < (SELECT count(afield1) FROM afile b WHERE a.afield1 = b.afield1);
Но это довольно медленно.
Это действительно мой предпочтительный способ, потому что вы можете вернуть все столбцы таблицы. – leek 2008-10-13 12:15:26
Как ни странно, 2 человека проголосовали за этот ответ, не комментируя почему. Я полагаю, это означает, что с ним что-то не так? – 2008-10-14 15:28:32
Я бы предположил, что он медленнее – 2008-10-14 21:03:29