У меня есть документы, идентификаторы которых генерируются случайным образом. Здесь я должен найти дубликаты среди этих документов. У меня есть три поля, которые не должны быть одинаковыми для двух документов. Итак, как проверить дубликаты на основе нескольких полей?Поиск дубликатов документов
Образцы документов
document 1 = {
"process" : "business",
"processId" : 5433321,
"country" : "US"
}
document 2 = {
"process" : "operations",
"processId" : 334233,
"country" : "UK"
}
document 3 = {
"process" : "business",
"processId" : 5433321,
"country" : "US"
}
Вот как вы можете видеть, документ 1 и документ 3 являются одинаковыми, но они имеют разные идентификаторы в моей базе данных, поэтому существуют в виде отдельных документов. Поэтому при запуске мне нужно найти выше, как дубликаты, и, если возможно, сохранить только один.
Можете ли вы показать образец документа с теми полями, о которых вы говорите? – Val