У меня есть запрос на отображение потенциальных дубликатов из списка записей телефонной книги с тем же имя, фамилия. Затем пользователь может объединить подозреваемые дубликаты после проверки дальнейших метаданных.Маркировка возможных дубликатов как отличных
То, что я не могу решить, заключается в том, как иметь способ маркировки пар как отдельных, а не дублирующих.
Я собирался создать таблицу, в которой отображаются пары, которые не являются дубликатами, но я не могу найти способ исключить их из сгенерированного подозрительного дублированного списка. Ниже приведен список SQL для списка. Я задавался вопросом о том, чтобы вернуть это, а затем запустить его в коде, но все же не совсем уверен, и я задавался вопросом, есть ли у кого-то эффективное решение.
SELECT p.*, COUNT(DISTINCT p.PersonId) AS num
FROM people p
GROUP BY CONCAT(p.FirstName, ' ', p.LastName)
HAVING num>1
Я делаю это в MySQL и C#, но принципы должны применяться к любому языку.
Вы ищете linq, эквивалентную вышеуказанному запросу sql? Если да, то предоставите свой linq, который вы опробовали. – Viki888
Привет viki888 спасибо за то, что спросили и извините, что было непонятно. Нет, я просто задавался вопросом, следует ли мне использовать LINQ или какой-либо другой метод, чтобы исключить пары, помеченные как дубликаты, после создания списка возможных дубликатов. – DuncanOppaz
Я думаю, что это то, о чем он спрашивает ... У вас есть два человека в базе данных (A и B), имеющих одно и то же имя. Система думает, что они могут быть одним и тем же человеком (дубликат), но пользователь знает, что они разные люди, поэтому она отмечает их каким-то образом как уникальные. Затем в базу данных добавляется человек C, который снова имеет то же имя. Система должна иметь возможность отмечать, что человек C может быть дубликатом A или B, но также знать, что A и B не являются одним и тем же лицом. – philwilks